맥타코

  • 설명 :

MC-TACO는 시간적 상식 이해가 필요한 13k 질문-답변 쌍의 데이터 세트입니다. 데이터 세트에는 다음과 같은 5가지 임시 속성이 포함되어 있습니다.

  1. 기간(이벤트 소요 시간)
  2. 시간 순서(일반적인 이벤트 순서)
  3. 일반 시간(이벤트가 발생할 때)
  4. 빈도(이벤트가 발생하는 빈도)
  5. 정상성(상태가 매우 오랜 시간 동안 또는 무기한으로 유지되는지 여부)

우리는 이 데이터 세트가 이 특정 유형의 추론 문제에 대한 향후 탐색을 촉진할 수 있기를 바랍니다.

나뉘다
'test' 9,442
'validation' 3,783
  • 기능 구조 :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'question': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
답변 텍스트
범주 클래스 레이블 int64
상표 클래스 레이블 int64
질문 텍스트
문장 텍스트
  • 인용 :
@inproceedings{ZKNR19,
    author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
    title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
    booktitle = {EMNLP},
    year = {2019},
}