wordnet

  • คำอธิบาย :

WordNet เป็นฐานข้อมูลคำศัพท์ภาษาอังกฤษขนาดใหญ่ คำนาม กริยา คำคุณศัพท์ และคำวิเศษณ์ถูกจัดกลุ่มเป็นชุดของคำพ้องความหมาย (ซินเซ็ต) แต่ละคำแสดงแนวคิดที่แตกต่างกัน Synsets เชื่อมโยงกันโดยใช้ความสัมพันธ์เชิงแนวคิดและความหมายและคำศัพท์

FeaturesDict({
   
'lhs': Text(shape=(), dtype=string),
   
'relation': Text(shape=(), dtype=string),
   
'rhs': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ลส ข้อความ สตริง
ความสัมพันธ์ ข้อความ สตริง
rhs ข้อความ สตริง

wordnet/WN18 (การกำหนดค่าเริ่มต้น)

  • คำอธิบาย การกำหนดค่า : WORDNET TENSOR DATA นี้ประกอบด้วยชุดของ triplets (synset, relation_type, triplet) ที่ดึงมาจาก WordNet 3.0 ( http://wordnet.princeton.edu ) ชุดข้อมูลนี้สามารถมองเป็นเทนเซอร์ 3 โหมดที่แสดงความสัมพันธ์แบบไตรภาคระหว่างซินเซ็ต ดู https://everest.hds.utc.fr/doku.php?id=th :transe

  • ขนาดชุดข้อมูล : 11.07 MiB

  • แยก :

แยก ตัวอย่าง
'test' 5,000
'train' 141,442
'validation' 5,000
  • การอ้างอิง :
@article{10.1145/219717.219748,
author
= {Miller, George A.},
title
= {WordNet: A Lexical Database for English},
year
= {1995},
issue_date
= {Nov. 1995},
publisher
= {Association for Computing Machinery},
address
= {New York, NY, USA},
volume
= {38},
number
= {11},
issn
= {0001-0782},
url
= {https://doi.org/10.1145/219717.219748},
doi
= {10.1145/219717.219748},
journal
= {Commun. ACM},
month
= nov,
pages
= {39--41},
numpages
= {3}
}

@incollection{NIPS2013_5071,
title
= {Translating Embeddings for Modeling Multi-relational Data},
author
= {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle
= {Advances in Neural Information Processing Systems 26},
editor
= {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages
= {2787--2795},
year
= {2013},
publisher
= {Curran Associates, Inc.},
url
= {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

เวิร์ดเน็ต/WN18RR

  • คำอธิบาย การกำหนดค่า : เหมือนกับ WN18 แต่แก้ไขการรั่วไหลของการทดสอบผ่านความสัมพันธ์ผกผัน ดู https://github.com/TimDettmers/ConvE

  • ขนาดชุดข้อมูล : 7.02 MiB

  • แยก :

แยก ตัวอย่าง
'test' 3,134
'train' 86,835
'validation' 3,034
  • การอ้างอิง :
@article{10.1145/219717.219748,
author
= {Miller, George A.},
title
= {WordNet: A Lexical Database for English},
year
= {1995},
issue_date
= {Nov. 1995},
publisher
= {Association for Computing Machinery},
address
= {New York, NY, USA},
volume
= {38},
number
= {11},
issn
= {0001-0782},
url
= {https://doi.org/10.1145/219717.219748},
doi
= {10.1145/219717.219748},
journal
= {Commun. ACM},
month
= nov,
pages
= {39--41},
numpages
= {3}
}

@inproceedings{dettmers2018conve,
   
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
   
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
   
Title = {Convolutional 2D Knowledge Graph Embeddings},
   
Url = {https://arxiv.org/abs/1707.01476},
   
Year = {2018},
        pages  
= {1811--1818},
   
Month = {February}
}