- توضیحات :
databricks-dolly-15k
یک مجموعه داده منبع باز از سوابق پیروی از دستورالعمل است که در آموزش databricks/dolly-v2-12b استفاده می شود که توسط هزاران کارمند Databricks در چندین دسته رفتاری که در مقاله InstructGPT ذکر شده است، از جمله طوفان فکری، طبقه بندی، تولید شده است. QA بسته، تولید، استخراج اطلاعات، QA باز و خلاصه سازی.
این مجموعه داده را می توان برای هر هدفی، اعم از دانشگاهی یا تجاری، تحت شرایط Creative Commons Attribution-ShareAlike 3.0 Unported License استفاده کرد.
صفحه اصلی : https://github.com/databrickslabs/dolly
کد منبع :
tfds.datasets.databricks_dolly.Builder
نسخه ها :
-
1.0.0
(پیش فرض): انتشار اولیه.
-
حجم دانلود :
12.60 MiB
حجم مجموعه داده :
12.69 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 15,014 |
- ساختار ویژگی :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
دسته بندی | متن | رشته | ||
متن نوشته | متن | رشته | ||
دستورالعمل | متن | رشته | ||
واکنش | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :