- 説明:
WordNet は、英語の大規模な語彙データベースです。名詞、動詞、形容詞、および副詞は、それぞれが異なる概念を表す一連の認知同義語 (synset) にグループ化されます。シンセットは、概念的意味論的および語彙的関係によって相互に関連しています。
追加のドキュメント:コード を使用したペーパーの探索
ホームページ: https://wordnet.princeton.edu/
ソース コード:
tfds.text.Wordnet
バージョン:
-
0.1.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
3.99 MiB
自動キャッシュ(ドキュメント): はい
機能構造:
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
lhs | 文章 | ストリング | ||
関係 | 文章 | ストリング | ||
右 | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ): サポートされていません。
wordnet/WN18 (デフォルト設定)
構成の説明: この WORDNET TENSOR DATA は、WordNet 3.0 ( http://wordnet.princeton.edu ) から抽出されたトリプレット (synset、relation_type、triplet) のコレクションで構成されます。このデータ セットは、synset 間の三元関係を表す 3 モード テンソルと見なすことができます。 https://everest.hds.utc.fr/doku.php?id=en :transe を参照してください。
データセットのサイズ:
11.07 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 5,000 |
'train' | 141,442 |
'validation' | 5,000 |
- 例( tfds.as_dataframe ):
- 引用:
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
ワードネット/WN18RR
構成の説明: WN18 と同じですが、逆の関係によるテストの漏れを修正します。 https://github.com/TimDettmers/ConvEを参照してください
データセットサイズ:
7.02 MiB
スプリット:
スプリット | 例 |
---|---|
'test' | 3,134 |
'train' | 86,835 |
'validation' | 3,034 |
- 例( tfds.as_dataframe ):
- 引用:
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}