qa4mre

  • Mô tả :

Tập dữ liệu QA4MRE được tạo cho CLEF 2011/2012/2013 chia sẻ các nhiệm vụ nhằm thúc đẩy nghiên cứu về trả lời câu hỏi và đọc hiểu. Tập dữ liệu chứa một đoạn văn hỗ trợ và một bộ câu hỏi tương ứng với đoạn văn. Nhiều tùy chọn cho câu trả lời được cung cấp cho mỗi câu hỏi, trong đó chỉ một câu trả lời đúng. Tập dữ liệu đào tạo và kiểm tra có sẵn cho bài hát chính. Các tài liệu tiêu chuẩn vàng bổ sung có sẵn cho hai nghiên cứu thử nghiệm: một về dữ liệu alzheimers và nghiên cứu khác về dữ liệu kỳ thi tuyển sinh.

FeaturesDict({
    'answer_options': Sequence({
        'answer_id': Text(shape=(), dtype=tf.string),
        'answer_str': Text(shape=(), dtype=tf.string),
    }),
    'correct_answer_id': Text(shape=(), dtype=tf.string),
    'correct_answer_str': Text(shape=(), dtype=tf.string),
    'document_id': Text(shape=(), dtype=tf.string),
    'document_str': Text(shape=(), dtype=tf.string),
    'question_id': Text(shape=(), dtype=tf.string),
    'question_str': Text(shape=(), dtype=tf.string),
    'test_id': Text(shape=(), dtype=tf.string),
    'topic_id': Text(shape=(), dtype=tf.string),
    'topic_name': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
answer_options Sự phối hợp
answer_options / answer_id Chữ tf.string
answer_options / answer_str Chữ tf.string
đúng_answer_id Chữ tf.string
đúng_answer_str Chữ tf.string
ID tài liệu Chữ tf.string
document_str Chữ tf.string
question_id Chữ tf.string
question_str Chữ tf.string
test_id Chữ tf.string
topic_id Chữ tf.string
Tên chủ đề Chữ tf.string
@InProceedings{10.1007/978-3-642-40802-1_29,
author="Pe{\~{n} }as, Anselmo
and Hovy, Eduard
and Forner, Pamela
and Rodrigo, {\'A}lvaro
and Sutcliffe, Richard
and Morante, Roser",
editor="Forner, Pamela
and M{\"u}ller, Henning
and Paredes, Roberto
and Rosso, Paolo
and Stein, Benno",
title="QA4MRE 2011-2013: Overview of Question Answering for Machine Reading Evaluation",
booktitle="Information Access Evaluation. Multilinguality, Multimodality, and Visualization",
year="2013",
publisher="Springer Berlin Heidelberg",
address="Berlin, Heidelberg",
pages="303--320",
abstract="This paper describes the methodology for testing the performance of Machine Reading systems through Question Answering and Reading Comprehension Tests. This was the attempt of the QA4MRE challenge which was run as a Lab at CLEF 2011--2013. The traditional QA task was replaced by a new Machine Reading task, whose intention was to ask questions that required a deep knowledge of individual short texts and in which systems were required to choose one answer, by analysing the corresponding test document in conjunction with background text collections provided by the organization. Four different tasks have been organized during these years: Main Task, Processing Modality and Negation for Machine Reading, Machine Reading of Biomedical Texts about Alzheimer's disease, and Entrance Exams. This paper describes their motivation, their goals, their methodology for preparing the data sets, their background collections, their metrics used for the evaluation, and the lessons learned along these three years.",
isbn="978-3-642-40802-1"
}

qa4mre / 2011.main.DE (cấu hình mặc định)

  • Mô tả cấu hình : Cấu hình này bao gồm bản nhạc chính cho ngôn ngữ DE trong năm 2011.

  • Kích thước tập dữ liệu : 1.69 MiB

  • Tách :

Tách ra Các ví dụ
'train' 120

qa4mre / 2011.main.EN

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ EN trong năm 2011.

  • Kích thước tập dữ liệu : 1.52 MiB

  • Tách :

Tách ra Các ví dụ
'train' 120

qa4mre / 2011.main.ES

  • Mô tả cấu hình : Cấu hình này bao gồm ca khúc chính cho ngôn ngữ ES trong năm 2011.

  • Kích thước tập dữ liệu : 1.64 MiB

  • Tách :

Tách ra Các ví dụ
'train' 120

qa4mre / 2011.main.IT

  • Mô tả cấu hình : Cấu hình này bao gồm đường dẫn chính cho ngôn ngữ CNTT trong năm 2011.

  • Kích thước tập dữ liệu : 1.61 MiB

  • Tách :

Tách ra Các ví dụ
'train' 120

qa4mre / 2011.main.RO

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ RO trong năm 2011.

  • Kích thước tập dữ liệu : 1.68 MiB

  • Tách :

Tách ra Các ví dụ
'train' 120

qa4mre / 2012.main.AR

  • Mô tả cấu hình : Cấu hình này bao gồm ca khúc chính cho ngôn ngữ AR trong năm 2012.

  • Kích thước tập dữ liệu : 2.62 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.BG

  • Mô tả cấu hình : Cấu hình này bao gồm bản nhạc chính cho ngôn ngữ BG trong năm 2012.

  • Kích thước tập dữ liệu : 3.33 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.DE

  • Mô tả cấu hình : Cấu hình này bao gồm bản nhạc chính cho ngôn ngữ DE trong năm 2012.

  • Kích thước tập dữ liệu : 2.02 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.EN

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ EN trong năm 2012.

  • Kích thước tập dữ liệu : 1.71 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.ES

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ ES trong năm 2012.

  • Kích thước tập dữ liệu : 1.99 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.IT

  • Mô tả cấu hình : Cấu hình này bao gồm đường dẫn chính cho ngôn ngữ CNTT trong năm 2012.

  • Kích thước tập dữ liệu : 2.01 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.main.RO

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ RO trong năm 2012.

  • Kích thước tập dữ liệu : 2.01 MiB

  • Tách :

Tách ra Các ví dụ
'train' 160

qa4mre / 2012.alzheimers.EN

  • Mô tả cấu hình : Cấu hình này bao gồm theo dõi các bộ biến âm cho ngôn ngữ EN trong năm 2012.

  • Kích thước tập dữ liệu : 1.57 MiB

  • Tách :

Tách ra Các ví dụ
'train' 40

qa4mre / 2013.main.AR

  • Mô tả cấu hình : Cấu hình này bao gồm ca khúc chính cho ngôn ngữ AR trong năm 2013.

  • Kích thước tập dữ liệu : 4.04 MiB

  • Tách :

Tách ra Các ví dụ
'train' 284

qa4mre / 2013.main.BG

  • Mô tả cấu hình : Cấu hình này bao gồm bản nhạc chính cho ngôn ngữ BG trong năm 2013.

  • Kích thước tập dữ liệu : 5.21 MiB

  • Tách :

Tách ra Các ví dụ
'train' 284

qa4mre / 2013.main.EN

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ EN trong năm 2013.

  • Kích thước tập dữ liệu : 2.81 MiB

  • Tách :

Tách ra Các ví dụ
'train' 284

qa4mre / 2013.main.ES

  • Mô tả cấu hình : Cấu hình này bao gồm ca khúc chính cho ngôn ngữ ES trong năm 2013.

  • Kích thước tập dữ liệu : 3.35 MiB

  • Tách :

Tách ra Các ví dụ
'train' 284

qa4mre / 2013.main.RO

  • Mô tả cấu hình : Cấu hình này bao gồm rãnh chính cho ngôn ngữ RO trong năm 2013.

  • Kích thước tập dữ liệu : 3.26 MiB

  • Tách :

Tách ra Các ví dụ
'train' 284

qa4mre / 2013.alzheimers.EN

  • Mô tả cấu hình : Cấu hình này bao gồm theo dõi các bộ biến âm cho ngôn ngữ EN trong năm 2013.

  • Kích thước tập dữ liệu : 2.50 MiB

  • Tách :

Tách ra Các ví dụ
'train' 40

qa4mre / 2013.entrance_exam.EN

  • Mô tả cấu hình : Cấu hình này bao gồm theo dõi entry_exam cho ngôn ngữ EN trong năm 2013.

  • Kích thước tập dữ liệu: 186.01 KiB

  • Tách :

Tách ra Các ví dụ
'train' 46