- توضیحات :
مجموعه داده شرح داده شده در مقاله: دستورالعمل های غیر طبیعی: مدل های زبان تنظیم با (تقریباً) بدون کار انسانی (2022). شامل مجموعهای از دستورالعملهای زبان طبیعی، با محدودیتهای اختیاری / فرمولبندیهای مجدد ایجاد شده توسط LLM.
صفحه اصلی : https://github.com/orhonovich/unnatural-instructions
کد منبع :
tfds.text.unnatural_instructions.UnnaturalInstructions
نسخه ها :
-
0.0.1
(پیش فرض): انتشار اولیه. دستورالعمل ها / ورودی ها را حذف کنید، زیرا آنها نیاز به پردازش اضافی دارند. Instruction_with_inputs و reformulation ها حاوی دستورالعمل ها و زمینه ها هستند.
-
حجم دانلود :
17.48 MiB
حجم مجموعه داده :
154.71 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 66010 |
- ساختار ویژگی :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
شناسه | متن | رشته | به عنوان مثال شناسه منحصر به فرد. | |
نمونه ها | توالی | |||
موارد/محدودیت ها | متن | رشته | محدودیت های خاص وظیفه | |
نمونه ها / ورودی | متن | رشته | ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود. | |
instances/instruction_with_input | متن | رشته | دستورالعملهایی با ورودیهای ارائه شده به جایبانها. | |
نمونه ها/خروجی ها | متن | رشته | خروجی هدف برای کار داده شده | |
دستورالعمل | متن | رشته | دستورالعمل با متغیرهایی برای ورودی ها. | |
فرمول بندی مجدد | توالی | |||
فرمول بندی مجدد / ورودی | متن | رشته | ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود. | |
فرمول بندی مجدد/دستورالعمل | متن | رشته | دستورالعمل با متغیرهایی برای ورودی ها. | |
فرمول بندی مجدد/دستورالعمل_با_ورودی | متن | رشته | دستورالعملهایی با ورودیهای ارائه شده به جایبانها. | |
فرمول بندی مجدد / خروجی | متن | رشته | خروجی هدف برای کار داده شده |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}