wordnet

  • Mô tả :

WordNet là một cơ sở dữ liệu từ vựng lớn của tiếng Anh. Danh từ, động từ, tính từ và trạng từ được nhóm lại thành các tập hợp từ đồng nghĩa nhận thức (synsets), mỗi từ thể hiện một khái niệm riêng biệt. Các tập hợp được liên kết với nhau bằng các quan hệ khái niệm-ngữ nghĩa và từ vựng.

FeaturesDict({
    'lhs': Text(shape=(), dtype=string),
    'relation': Text(shape=(), dtype=string),
    'rhs': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
lhs Chữ sợi dây
quan hệ Chữ sợi dây
rhs Chữ sợi dây

wordnet/WN18 (cấu hình mặc định)

  • Mô tả cấu hình : DỮ LIỆU TENSOR WORDNET này bao gồm một tập hợp các bộ ba (bộ đồng bộ, kiểu_quan hệ, bộ ba) được trích xuất từ ​​Mạng từ 3.0 ( http://wordnet.princeton.edu ). Tập dữ liệu này có thể được coi là một tensor 3 chế độ mô tả các mối quan hệ bậc ba giữa các synset. Xem https://everest.hds.utc.fr/doku.php?id=en :transe.

  • Kích thước tập dữ liệu : 11.07 MiB

  • Chia tách :

Tách ra ví dụ
'test' 5.000
'train' 141,442
'validation' 5.000
  • trích dẫn :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

mạng từ/WN18RR

  • Mô tả cấu hình : Tương tự như WN18 nhưng sửa lỗi rò rỉ kiểm tra thông qua các mối quan hệ nghịch đảo. Xem https://github.com/TimDettmers/ConvE

  • Kích thước tập dữ liệu : 7.02 MiB

  • Chia tách :

Tách ra ví dụ
'test' 3.134
'train' 86,835
'validation' 3.034
  • trích dẫn :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}