- Mô tả :
Được sáng tác bởi 30 sinh viên từ một trong những lớp đại học của tác giả. Các cặp câu này bao gồm các chủ đề khác nhau, từ các sự kiện có thật (ví dụ: kế hoạch của Iran tấn công đại sứ Ả Rập Xê-út tại Mỹ) đến các sự kiện / nhân vật trong phim (ví dụ: Người dơi) và các tình huống hoàn toàn tưởng tượng, phần lớn phản ánh văn hóa đại chúng theo nhận thức của trẻ em Mỹ ra đời vào đầu những năm 90. Mỗi ví dụ chú thích kéo dài bốn dòng: dòng đầu tiên chứa câu, dòng thứ hai chứa đại từ đích, dòng thứ ba chứa hai tiền đề ứng cử viên và dòng thứ tư chứa tiền đề chính xác. Nếu đại từ đích xuất hiện nhiều hơn một lần trong câu, thì lần xuất hiện đầu tiên của nó là lần được giải quyết.
Trang chủ : http://www.hlt.utdallas.edu/~vince/data/emnlp12/
Mã nguồn :
tfds.text.DefinitePronounResolution
Các phiên bản :
-
1.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
222.12 KiB
Kích thước tập dữ liệu:
334.22 KiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Tách :
Tách ra | Các ví dụ |
---|---|
'test' | 564 |
'train' | 1,322 |
- Cấu trúc tính năng :
FeaturesDict({
'candidates': Sequence(Text(shape=(), dtype=tf.string)),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'pronoun': Text(shape=(), dtype=tf.string),
'sentence': Text(shape=(), dtype=tf.string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Loại | Sự miêu tả |
---|---|---|---|---|
Các tính năng | ||||
ứng cử viên | Trình tự (Văn bản) | (2,) | tf.string | |
nhãn mác | ClassLabel | tf.int64 | ||
đại từ | Bản văn | tf.string | ||
câu | Bản văn | tf.string |
Khóa được giám sát (Xem
as_supervised
doc ):('sentence', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :
@inproceedings{rahman2012resolving,
title={Resolving complex cases of definite pronouns: the winograd schema challenge},
author={Rahman, Altaf and Ng, Vincent},
booktitle={Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning},
pages={777--789},
year={2012},
organization={Association for Computational Linguistics}
}