- 설명 :
QA4MRE 데이터 세트는 질문 답변 및 독해 연구를 촉진하기 위해 CLEF 2011/2012/2013 공유 작업을 위해 생성되었습니다. 데이터 세트에는 지원 구절과 해당 구절에 해당하는 일련의 질문이 포함되어 있습니다. 각 질문에 대해 답변에 대한 여러 옵션이 제공되며 그 중 하나만 정답입니다. 교육 및 테스트 데이터 세트는 기본 트랙에서 사용할 수 있습니다. 추가 표준 문서는 두 개의 파일럿 연구에 사용할 수 있습니다. 하나는 알츠하이머 데이터에 대한 것이고 다른 하나는 입학 시험 데이터에 대한 것입니다.
홈페이지 : http://nlp.uned.es/clef-qa/repository/pastCampaigns.php
소스 코드 :
tfds.datasets.qa4mre.Builder
버전 :
-
0.1.0
(기본값): 릴리스 정보가 없습니다.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'answer_options': Sequence({
'answer_id': Text(shape=(), dtype=string),
'answer_str': Text(shape=(), dtype=string),
}),
'correct_answer_id': Text(shape=(), dtype=string),
'correct_answer_str': Text(shape=(), dtype=string),
'document_id': Text(shape=(), dtype=string),
'document_str': Text(shape=(), dtype=string),
'question_id': Text(shape=(), dtype=string),
'question_str': Text(shape=(), dtype=string),
'test_id': Text(shape=(), dtype=string),
'topic_id': Text(shape=(), dtype=string),
'topic_name': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
답변 옵션 | 순서 | |||
answer_options/answer_id | 텍스트 | 끈 | ||
answer_options/answer_str | 텍스트 | 끈 | ||
correct_answer_id | 텍스트 | 끈 | ||
correct_answer_str | 텍스트 | 끈 | ||
document_id | 텍스트 | 끈 | ||
document_str | 텍스트 | 끈 | ||
question_id | 텍스트 | 끈 | ||
question_str | 텍스트 | 끈 | ||
test_id | 텍스트 | 끈 | ||
topic_id | 텍스트 | 끈 | ||
주제_이름 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@InProceedings{10.1007/978-3-642-40802-1_29,
author="Pe{\~{n} }as, Anselmo
and Hovy, Eduard
and Forner, Pamela
and Rodrigo, {\'A}lvaro
and Sutcliffe, Richard
and Morante, Roser",
editor="Forner, Pamela
and M{\"u}ller, Henning
and Paredes, Roberto
and Rosso, Paolo
and Stein, Benno",
title="QA4MRE 2011-2013: Overview of Question Answering for Machine Reading Evaluation",
booktitle="Information Access Evaluation. Multilinguality, Multimodality, and Visualization",
year="2013",
publisher="Springer Berlin Heidelberg",
address="Berlin, Heidelberg",
pages="303--320",
abstract="This paper describes the methodology for testing the performance of Machine Reading systems through Question Answering and Reading Comprehension Tests. This was the attempt of the QA4MRE challenge which was run as a Lab at CLEF 2011--2013. The traditional QA task was replaced by a new Machine Reading task, whose intention was to ask questions that required a deep knowledge of individual short texts and in which systems were required to choose one answer, by analysing the corresponding test document in conjunction with background text collections provided by the organization. Four different tasks have been organized during these years: Main Task, Processing Modality and Negation for Machine Reading, Machine Reading of Biomedical Texts about Alzheimer's disease, and Entrance Exams. This paper describes their motivation, their goals, their methodology for preparing the data sets, their background collections, their metrics used for the evaluation, and the lessons learned along these three years.",
isbn="978-3-642-40802-1"
}
qa4mre/2011.main.DE(기본 구성)
구성 설명 : 이 구성에는 2011년 DE 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
217.08 KiB
데이터 세트 크기 :
1.69 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 120 |
- 예 ( tfds.as_dataframe ):
qa4mre/2011.main.EN
구성 설명 : 이 구성에는 2011년 EN 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
197.74 KiB
데이터 세트 크기 :
1.52 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 120 |
- 예 ( tfds.as_dataframe ):
qa4mre/2011.main.ES
구성 설명 : 이 구성에는 2011년 ES 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
212.52 KiB
데이터 세트 크기 :
1.64 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 120 |
- 예 ( tfds.as_dataframe ):
qa4mre/2011.main.IT
구성 설명 : 이 구성에는 2011년 IT 언어의 주요 트랙이 포함되어 있습니다.
다운로드 크기 :
209.73 KiB
데이터 세트 크기 :
1.61 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 120 |
- 예 ( tfds.as_dataframe ):
qa4mre/2011.main.RO
구성 설명 : 이 구성에는 2011년 RO 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
216.32 KiB
데이터 세트 크기 :
1.68 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 120 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.AR
구성 설명 : 이 구성에는 2012년 AR 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
347.83 KiB
데이터 세트 크기 :
2.62 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.BG
구성 설명 : 이 구성에는 2012년 BG 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
434.63 KiB
데이터 세트 크기 :
3.33 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.DE
구성 설명 : 이 구성에는 2012년 DE 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
275.00 KiB
데이터 세트 크기 :
2.02 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.EN
구성 설명 : 이 구성에는 2012년 EN 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
237.76 KiB
데이터 세트 크기 :
1.71 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.ES
구성 설명 : 이 구성에는 2012년 ES 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
271.92 KiB
데이터 세트 크기 :
1.99 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.IT
구성 설명 : 이 구성에는 2012년 IT 언어의 주요 트랙이 포함되어 있습니다.
다운로드 크기 :
273.49 KiB
데이터 세트 크기 :
2.01 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.main.RO
구성 설명 : 이 구성에는 2012년 RO 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
272.99 KiB
데이터 세트 크기 :
2.01 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 160 |
- 예 ( tfds.as_dataframe ):
qa4mre/2012.alzheimers.EN
구성 설명 : 이 구성에는 2012년 EN 언어에 대한 알츠하이머 트랙이 포함되어 있습니다.
다운로드 크기 :
173.19 KiB
데이터 세트 크기 :
1.57 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 40 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.main.AR
구성 설명 : 이 구성에는 2013년 AR 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
369.44 KiB
데이터 세트 크기 :
4.04 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 284 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.main.BG
구성 설명 : 이 구성에는 2013년 BG 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
452.74 KiB
데이터 세트 크기 :
5.21 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 284 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.main.EN
구성 설명 : 이 구성에는 2013년 EN 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
268.52 KiB
데이터 세트 크기 :
2.81 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 284 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.main.ES
구성 설명 : 이 구성에는 2013년 ES 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
307.78 KiB
데이터 세트 크기 :
3.35 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 284 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.main.RO
구성 설명 : 이 구성에는 2013년 RO 언어의 메인 트랙이 포함되어 있습니다.
다운로드 크기 :
306.16 KiB
데이터 세트 크기 :
3.26 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 284 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.alzheimers.EN
구성 설명 : 이 구성에는 2013년 EN 언어에 대한 알츠하이머 트랙이 포함되어 있습니다.
다운로드 크기 :
267.98 KiB
데이터 세트 크기 :
2.50 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 40 |
- 예 ( tfds.as_dataframe ):
qa4mre/2013.entrance_exam.EN
구성 설명 : 이 구성에는 2013년 EN 언어에 대한 entrance_exam 트랙이 포함되어 있습니다.
다운로드 크기 :
53.32 KiB
데이터 세트 크기 :
186.01 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 46 |
- 예 ( tfds.as_dataframe ):