wordnet

  • Mô tả :

Mạng từ là một cơ sở dữ liệu từ vựng lớn về tiếng Anh. Danh từ, động từ, tính từ và trạng từ được nhóm lại thành các tập hợp các từ đồng nghĩa nhận thức (synsets), mỗi từ thể hiện một khái niệm riêng biệt. Các tập hợp được liên kết với nhau bằng các quan hệ khái niệm-ngữ nghĩa và từ vựng.

FeaturesDict({
    'lhs': Text(shape=(), dtype=tf.string),
    'relation': Text(shape=(), dtype=tf.string),
    'rhs': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
lhs Chữ tf.string
quan hệ Chữ tf.string
rhs Chữ tf.string

wordnet / WN18 (cấu hình mặc định)

  • Mô tả cấu hình : DỮ LIỆU CẢM BIẾN WORDNET này bao gồm một tập hợp các bộ ba (synset, Relations_type, triplet) được trích xuất từ ​​WordNet 3.0 ( http://wordnet.princeton.edu ). Tập dữ liệu này có thể được xem như một tensor 3 chế độ mô tả các mối quan hệ bậc ba giữa các synsets. Xem https://everest.hds.utc.fr/doku.php?id=en : transe.

  • Kích thước tập dữ liệu : 11.07 MiB

  • Tách :

Tách ra Các ví dụ
'test' 5.000
'train' 141.442
'validation' 5.000
  • Trích dẫn :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

wordnet / WN18RR

  • Mô tả cấu hình : Giống như WN18 nhưng sửa lỗi rò rỉ kiểm tra thông qua quan hệ nghịch đảo. Xem https://github.com/TimDettmers/ConvE

  • Kích thước tập dữ liệu : 7.02 MiB

  • Tách :

Tách ra Các ví dụ
'test' 3.134
'train' 86.835
'validation' 3.034
  • Trích dẫn :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}