- Mô tả :
XNLI là một tập hợp con của vài nghìn ví dụ từ MNLI đã được dịch sang 14 ngôn ngữ khác nhau (một số tài nguyên cấp thấp). Như với MNLI, mục tiêu là dự đoán sự kéo theo của văn bản (câu A có ngụ ý/mâu thuẫn/không phải câu B) và là một nhiệm vụ phân loại (được đưa ra hai câu, dự đoán một trong ba nhãn).
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.nyu.edu/projects/bowman/xnli/
Mã nguồn :
tfds.text.Xnli
Phiên bản :
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
17.04 MiB
Kích thước tập dữ liệu :
29.62 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5.010 |
'validation' | 2.490 |
- Cấu trúc tính năng :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
giả thuyết | DịchBiếnNgôn ngữ | |||
giả thuyết/ngôn ngữ | Chữ | sợi dây | ||
giả thuyết/bản dịch | Chữ | sợi dây | ||
nhãn mác | LớpNhãn | int64 | ||
tiền đề | Dịch | |||
tiền đề / ar | Chữ | sợi dây | ||
tiền đề/bg | Chữ | sợi dây | ||
tiền đề / de | Chữ | sợi dây | ||
tiền đề / el | Chữ | sợi dây | ||
tiền đề/vi | Chữ | sợi dây | ||
tiền đề / es | Chữ | sợi dây | ||
tiền đề / fr | Chữ | sợi dây | ||
tiền đề / xin chào | Chữ | sợi dây | ||
tiền đề / ru | Chữ | sợi dây | ||
tiền đề/sw | Chữ | sợi dây | ||
tiền đề / thứ | Chữ | sợi dây | ||
tiền đề/tr | Chữ | sợi dây | ||
tiền đề / bạn | Chữ | sợi dây | ||
tiền đề/vi | Chữ | sợi dây | ||
tiền đề/zh | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}
, - Mô tả :
XNLI là một tập hợp con của vài nghìn ví dụ từ MNLI đã được dịch sang 14 ngôn ngữ khác nhau (một số tài nguyên cấp thấp). Như với MNLI, mục tiêu là dự đoán sự kéo theo của văn bản (câu A có ngụ ý/mâu thuẫn/không phải câu B) và là một nhiệm vụ phân loại (được đưa ra hai câu, dự đoán một trong ba nhãn).
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.nyu.edu/projects/bowman/xnli/
Mã nguồn :
tfds.text.Xnli
Phiên bản :
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
17.04 MiB
Kích thước tập dữ liệu :
29.62 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5.010 |
'validation' | 2.490 |
- Cấu trúc tính năng :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
giả thuyết | DịchBiếnNgôn ngữ | |||
giả thuyết/ngôn ngữ | Chữ | sợi dây | ||
giả thuyết/bản dịch | Chữ | sợi dây | ||
nhãn mác | LớpNhãn | int64 | ||
tiền đề | Dịch | |||
tiền đề / ar | Chữ | sợi dây | ||
tiền đề/bg | Chữ | sợi dây | ||
tiền đề / de | Chữ | sợi dây | ||
tiền đề / el | Chữ | sợi dây | ||
tiền đề/vi | Chữ | sợi dây | ||
tiền đề / es | Chữ | sợi dây | ||
tiền đề / fr | Chữ | sợi dây | ||
tiền đề / xin chào | Chữ | sợi dây | ||
tiền đề / ru | Chữ | sợi dây | ||
tiền đề/sw | Chữ | sợi dây | ||
tiền đề / thứ | Chữ | sợi dây | ||
tiền đề/tr | Chữ | sợi dây | ||
tiền đề / bạn | Chữ | sợi dây | ||
tiền đề/vi | Chữ | sợi dây | ||
tiền đề/zh | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@InProceedings{conneau2018xnli,
author = "Conneau, Alexis
and Rinott, Ruty
and Lample, Guillaume
and Williams, Adina
and Bowman, Samuel R.
and Schwenk, Holger
and Stoyanov, Veselin",
title = "XNLI: Evaluating Cross-lingual Sentence Representations",
booktitle = "Proceedings of the 2018 Conference on Empirical Methods
in Natural Language Processing",
year = "2018",
publisher = "Association for Computational Linguistics",
location = "Brussels, Belgium",
}