- विवरण :
गुणवत्ता, एक बहुविकल्पी, लंबे समय तक पढ़ने वाला बोध डेटासेट।
हम केवल कच्चा संस्करण प्रदान करते हैं।
होमपेज : https://github.com/nyu-mll/quality
स्रोत कोड :
tfds.datasets.quality.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
17.26 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- फ़ीचर संरचना :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| लेख | मूलपाठ | डोरी | ||
| article_id | मूलपाठ | डोरी | ||
| कठिनाइयाँ | अनुक्रम (टेंसर) | (कोई भी नहीं,) | बूल | |
| gold_labels | अनुक्रम (टेंसर) | (कोई भी नहीं,) | int32 | |
| विकल्प | अनुक्रम (अनुक्रम (पाठ)) | (कोई नहीं, कोई नहीं) | डोरी | |
| प्रश्न_आईडी | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
| प्रशन | अनुक्रम (पाठ) | (कोई भी नहीं,) | डोरी | |
| set_unique_id | मूलपाठ | डोरी | ||
| स्रोत | मूलपाठ | डोरी | ||
| शीर्षक | मूलपाठ | डोरी | ||
| विषय | मूलपाठ | डोरी | ||
| यूआरएल | मूलपाठ | डोरी | ||
| लेखक_आईडी | मूलपाठ | डोरी | ||
| लेखक_लेबल | अनुक्रम (टेंसर) | (कोई भी नहीं,) | int32 |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
गुणवत्ता/कच्चा (डिफ़ॉल्ट कॉन्फ़िगरेशन)
विन्यास विवरण : HTML के साथ कच्चा।
डेटासेट का आकार :
22.18 MiBउदाहरण ( tfds.as_dataframe ):
गुणवत्ता / छीन लिया
विन्यास विवरण : HTML से अलग।
डेटासेट का आकार :
20.73 MiBउदाहरण ( tfds.as_dataframe ):