کیفیت

  • توضیحات :

QALITY، مجموعه داده درک مطلب چند گزینه ای و طولانی مدت.

ما فقط نسخه خام را ارائه می دهیم.

شکاف مثال ها
'dev' 230
'test' 232
'train' 300
  • ساختار ویژگی :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
مقاله متن رشته
article_id متن رشته
دشواری ها دنباله (تنسور) (هیچ یک،) بوول
برچسب های طلایی دنباله (تنسور) (هیچ یک،) int32
گزینه ها دنباله (توالی (متن)) (هیچ، هیچکدام) رشته
question_ids دنباله (متن) (هیچ یک،) رشته
سوالات دنباله (متن) (هیچ یک،) رشته
set_unique_id متن رشته
منبع متن رشته
عنوان متن رشته
موضوع متن رشته
آدرس اینترنتی متن رشته
writer_id متن رشته
نویسنده_برچسب ها دنباله (تنسور) (هیچ یک،) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

کیفیت/خام (پیکربندی پیش فرض)

  • توضیحات پیکربندی : خام با HTML.

  • حجم مجموعه داده : 22.18 MiB

  • مثال‌ها ( tfds.as_dataframe ):

با کیفیت / برهنه

  • توضیحات پیکربندی : فاقد HTML.

  • حجم مجموعه داده : 20.73 MiB

  • مثال‌ها ( tfds.as_dataframe ):