- विवरण :
पेपर में वर्णित डेटासेट: अप्राकृतिक निर्देश: ट्यूनिंग भाषा मॉडल (लगभग) कोई मानव श्रम नहीं (2022)। वैकल्पिक बाधाओं / एलएलएम-जनित सुधारों के साथ प्राकृतिक-भाषा निर्देशों के सेट शामिल हैं।
होमपेज : https://github.com/orhonovich/unnatural-instructions
स्रोत कोड :
tfds.text.unnatural_instructions.UnnaturalInstructionsसंस्करण :
-
0.0.1(डिफ़ॉल्ट): आरंभिक रिलीज़। निर्देशों/इनपुट को छोड़ दें, क्योंकि उन्हें उपयोग करने के लिए अतिरिक्त प्रोसेसिंग की आवश्यकता होती है। Instruction_with_inputs और सुधारों में निर्देश और संदर्भ होते हैं।
-
डाउनलोड आकार :
17.48 MiBडेटासेट का आकार :
154.71 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False(ट्रेन)विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 66,010 |
- फ़ीचर संरचना :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| पहचान | लेख | डोरी | उदाहरण के लिए विशिष्ट पहचानकर्ता। | |
| उदाहरणों | अनुक्रम | |||
| उदाहरण/बाधाएं | लेख | डोरी | कार्य-विशिष्ट बाधाएँ। | |
| उदाहरण/इनपुट | लेख | डोरी | दिए गए निर्देश के लिए इनपुट को प्लेसहोल्डर्स में फीड किया जाना है। | |
| उदाहरण/निर्देश_with_input | लेख | डोरी | प्लेसहोल्डर्स को दिए गए इनपुट के साथ निर्देश। | |
| उदाहरण/आउटपुट | लेख | डोरी | दिए गए कार्य के लिए लक्ष्य आउटपुट। | |
| अनुदेश | लेख | डोरी | इनपुट के लिए प्लेसहोल्डर के साथ निर्देश। | |
| सुधार | अनुक्रम | |||
| सुधार / इनपुट | लेख | डोरी | दिए गए निर्देश के लिए इनपुट को प्लेसहोल्डर्स में फीड किया जाना है। | |
| सुधार / निर्देश | लेख | डोरी | इनपुट के लिए प्लेसहोल्डर के साथ निर्देश। | |
| सुधार/निर्देश_with_input | लेख | डोरी | प्लेसहोल्डर्स को दिए गए इनपुट के साथ निर्देश। | |
| सुधार / आउटपुट | लेख | डोरी | दिए गए कार्य के लिए लक्ष्य आउटपुट। |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}