- 설명 :
BoolQ는 15942개의 예를 포함하는 예/아니오 질문에 대한 질문 응답 데이터 세트입니다. 이러한 질문은 자연스럽게 발생하며, 즉흥적이고 제약이 없는 환경에서 생성됩니다.
각 예제는 선택적인 추가 컨텍스트로 페이지 제목이 있는 (질문, 구절, 답변)의 삼중 항입니다. 텍스트 쌍 분류 설정은 기존의 자연어 추론 작업과 유사합니다.
홈페이지 : https://github.com/google-research-datasets/boolean-questions
소스 코드 :
tfds.datasets.bool_q.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
8.36 MiB
데이터 세트 크기 :
8.51 MiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'train' | 9,427 |
'validation' | 3,270 |
- 기능 구조 :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
대답 | 텐서 | 부울 | ||
통로 | 텍스트 | 끈 | ||
의문 | 텍스트 | 끈 | ||
제목 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}