- Mô tả:
Tập dữ liệu LAMBADA đánh giá khả năng của các mô hình tính toán để hiểu văn bản bằng nhiệm vụ dự đoán từ. LAMBADA là một tập hợp các đoạn văn tường thuật có đặc điểm là đối tượng con người có thể đoán từ cuối cùng của họ nếu họ tiếp xúc với toàn bộ đoạn văn, nhưng không phải nếu họ chỉ nhìn thấy câu cuối cùng trước từ đích.
Source code:
tfds.text.lambada.Lambada
phiên bản:
-
1.0.0
(mặc định): Phiên bản đầu tiên.
-
Dung lượng tải về:
319.03 MiB
Dataset kích thước:
3.49 MiB
Tự động lưu trữ ( tài liệu ): Có
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 5.153 |
'train' | 4.869 |
- Các tính năng:
FeaturesDict({
'passage': Text(shape=(), dtype=tf.string),
})
Phím giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}