جودة

  • الوصف :

QUALITY ، مجموعة بيانات متعددة الخيارات وقراءة طويلة.

نحن نقدم فقط النسخة الخام.

انشق، مزق أمثلة
'dev' 230
'test' 232
'train' 300
  • هيكل الميزة :
FeaturesDict({
    'article': Text(shape=(), dtype=string),
    'article_id': Text(shape=(), dtype=string),
    'difficults': Sequence(bool),
    'gold_labels': Sequence(int32),
    'options': Sequence(Sequence(Text(shape=(), dtype=string))),
    'question_ids': Sequence(Text(shape=(), dtype=string)),
    'questions': Sequence(Text(shape=(), dtype=string)),
    'set_unique_id': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
    'topic': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'writer_id': Text(shape=(), dtype=string),
    'writer_labels': Sequence(int32),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
مقالة - سلعة نص سلسلة
article_id نص سلسلة
صعب تسلسل (موتر) (لا أحد،) منطقي
علامات_ذهب تسلسل (موتر) (لا أحد،) int32
والخيارات تسلسل (تسلسل (نص)) (ليس ليس) سلسلة
الأسئلة_العربية تسلسل (نص) (لا أحد،) سلسلة
أسئلة تسلسل (نص) (لا أحد،) سلسلة
set_unique_id نص سلسلة
مصدر نص سلسلة
لقب نص سلسلة
عنوان نص سلسلة
عنوان url نص سلسلة
معرّف الكاتب نص سلسلة
كاتب_التصنيفات تسلسل (موتر) (لا أحد،) int32
@article{pang2021quality,
  title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
  author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
  journal={arXiv preprint arXiv:2112.08608},
  year={2021}
}

الجودة / الخام (التكوين الافتراضي)

  • وصف التكوين : خام مع HTML.

  • حجم مجموعة البيانات : 22.18 MiB

  • أمثلة ( tfds.as_dataframe ):

جودة / جردت

  • وصف التكوين : تم تجريده من HTML.

  • حجم مجموعة البيانات : 20.73 MiB

  • أمثلة ( tfds.as_dataframe ):