- 설명 :
MC-TACO는 시간적 상식 이해가 필요한 13k 질문-답변 쌍의 데이터 세트입니다. 데이터 세트에는 다음과 같은 5가지 임시 속성이 포함되어 있습니다.
- 기간(이벤트 소요 시간)
- 시간 순서(일반적인 이벤트 순서)
- 일반 시간(이벤트가 발생할 때)
- 빈도(이벤트가 발생하는 빈도)
- 정상성(상태가 매우 오랜 시간 동안 또는 무기한으로 유지되는지 여부)
우리는 이 데이터 세트가 이 특정 유형의 추론 문제에 대한 향후 탐색을 촉진할 수 있기를 바랍니다.
소스 코드 :
tfds.datasets.mctaco.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
2.27 MiB
데이터 세트 크기 :
3.18 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 9,442 |
'validation' | 3,783 |
- 기능 구조 :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변 | 텍스트 | 끈 | ||
범주 | 클래스 레이블 | int64 | ||
상표 | 클래스 레이블 | int64 | ||
질문 | 텍스트 | 끈 | ||
문장 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}