lambada

  • Mô tả:

Tập dữ liệu LAMBADA đánh giá khả năng của các mô hình tính toán để hiểu văn bản bằng nhiệm vụ dự đoán từ. LAMBADA là một tập hợp các đoạn văn tường thuật có đặc điểm là đối tượng con người có thể đoán từ cuối cùng của họ nếu họ tiếp xúc với toàn bộ đoạn văn, nhưng không phải nếu họ chỉ nhìn thấy câu cuối cùng trước từ đích.

Tách ra Các ví dụ
'test' 5.153
'train' 4.869
  • Các tính năng:
FeaturesDict({
    'passage': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@inproceedings{paperno-etal-2016-lambada,
    title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
    author = "Paperno, Denis  and
      Kruszewski, Germ{'a}n  and
      Lazaridou, Angeliki  and
      Pham, Ngoc Quan  and
      Bernardi, Raffaella  and
      Pezzelle, Sandro  and
      Baroni, Marco  and
      Boleda, Gemma  and
      Fern{'a}ndez, Raquel",
    booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = aug,
    year = "2016",
    address = "Berlin, Germany",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P16-1144",
    doi = "10.18653/v1/P16-1144",
    pages = "1525--1534",
}