- Mô tả :
Sáng tác bởi 30 sinh viên từ một trong các lớp đại học của tác giả. Các cặp câu này bao gồm các chủ đề từ các sự kiện có thật (ví dụ: kế hoạch tấn công đại sứ Ả Rập Xê Út tại Mỹ của Iran) đến các sự kiện/nhân vật trong phim (ví dụ: Người Dơi) và các tình huống hoàn toàn do tưởng tượng, phần lớn phản ánh văn hóa đại chúng theo cảm nhận của trẻ em Mỹ sinh vào đầu những năm 90. Mỗi ví dụ được chú thích kéo dài bốn dòng: dòng đầu tiên chứa câu, dòng thứ hai chứa đại từ đích, dòng thứ ba chứa hai tiền đề ứng cử viên và dòng thứ tư chứa tiền đề chính xác. Nếu đại từ mục tiêu xuất hiện nhiều lần trong câu, thì lần xuất hiện đầu tiên của nó là lần cần giải quyết.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.hlt.utdallas.edu/~vince/data/emnlp12/
Mã nguồn :
tfds.text.DefinitePronounResolution
Phiên bản :
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
222.12 KiB
Kích thước tập dữ liệu :
334.22 KiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 564 |
'train' | 1.322 |
- Cấu trúc tính năng :
FeaturesDict({
'candidates': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pronoun': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
ứng cử viên | Trình tự (Văn bản) | (2,) | sợi dây | |
nhãn | LớpNhãn | int64 | ||
đại từ | Chữ | sợi dây | ||
câu | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('sentence', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{rahman2012resolving,
title={Resolving complex cases of definite pronouns: the winograd schema challenge},
author={Rahman, Altaf and Ng, Vincent},
booktitle={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
pages={777--789},
year={2012},
organization={Association for Computational Linguistics}
}