answer_equivalence

توضیحات :

مجموعه داده معادل پاسخ شامل رتبه‌بندی‌های انسانی در پیش‌بینی مدل از چندین مدل در مجموعه داده SQuAD است. رتبه‌بندی‌ها تعیین می‌کنند که آیا پاسخ پیش‌بینی‌شده «معادل» با پاسخ طلاست (با در نظر گرفتن سؤال و زمینه).

به طور خاص، منظور ما از «معادل» این است که پاسخ پیش‌بینی‌شده حداقل اطلاعاتی مشابه با پاسخ طلا دارد و اطلاعات اضافی اضافه نمی‌کند. مجموعه داده حاوی حاشیه نویسی برای: * پیش بینی های BiDAF در SQuAD dev * پیش بینی های XLNet در SQuAD dev * پیش بینی های لوک در SQuAD dev * پیش بینی های آلبرت در آموزش SQuAD، توسعه دهنده و نمونه های تست

صفحه اصلی : https://github.com/google-research-datasets/answer-equivalence-dataset
کد منبع : tfds.datasets.answer_equivalence.Builder
نسخه ها :
- 1.0.0 (پیش فرض): انتشار اولیه.
حجم دانلود : 45.86 MiB
حجم مجموعه داده : 47.24 MiB
ذخیره خودکار ( اسناد ): بله
تقسیمات :

شکاف	مثال ها
`'ae_dev'`	4,446
`'ae_test'`	9,724
`'dev_bidaf'`	7,522
`'dev_luke'`	4590
`'dev_xlnet'`	7,932
`'train'`	9,090

ساختار ویژگی :

FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})

مستندات ویژگی :

ویژگی	کلاس	نوع D
	FeaturesDict
نامزد	متن	رشته
متن نوشته	متن	رشته
gold_index	تانسور	int32
qid	متن	رشته
سوال	متن	رشته
سوال 1	ClassLabel	int64
سوال 2	ClassLabel	int64
سوال_3	ClassLabel	int64
سوال_4	ClassLabel	int64
مرجع	متن	رشته
نمره	تانسور	float32

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}