- תיאור :
WordNet הוא מסד נתונים מילוני גדול של אנגלית. שמות עצם, פעלים, תארים ותוארים מקובצים לקבוצות של מילים נרדפות קוגניטיביות (סינסטים), כל אחת מבטאת מושג מובחן. סינסטים מקושרים ביניהם באמצעות יחסים מושגיים-סמנטיים ולקסיקליים.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://wordnet.princeton.edu/
קוד מקור :
tfds.text.Wordnet
גרסאות :
-
0.1.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
3.99 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'lhs': Text(shape=(), dtype=string),
'relation': Text(shape=(), dtype=string),
'rhs': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
lhs | טֶקסט | חוּט | ||
יַחַס | טֶקסט | חוּט | ||
rhs | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
wordnet/WN18 (תצורת ברירת המחדל)
תיאור תצורה : נתוני TENSOR WORDNET זה מורכבים מאוסף של שלישיות (synset, relation_type, triplet) שחולצו מ-WordNet 3.0 ( http://wordnet.princeton.edu ). ניתן לראות את מערך הנתונים הזה כטנזור בן 3 מצבים המתאר יחסים משולשים בין סינסטים. ראה https://everest.hds.utc.fr/doku.php?id=en :transe.
גודל ערכת נתונים :
11.07 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 5,000 |
'train' | 141,442 |
'validation' | 5,000 |
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
wordnet/WN18RR
תיאור תצורה : זהה ל-WN18 אבל מתקן דליפת בדיקה באמצעות יחסים הפוכים. ראה https://github.com/TimDettmers/ConvE
גודל מערך נתונים :
7.02 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 3,134 |
'train' | 86,835 |
'validation' | 3,034 |
- דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}