- الوصف :
databricks-dolly-15k
عبارة عن مجموعة بيانات مفتوحة المصدر لسجلات متابعة التعليمات المستخدمة في تدريب databricks/dolly-v2-12b والتي تم إنشاؤها بواسطة الآلاف من موظفي Databricks في العديد من الفئات السلوكية الموضحة في ورقة InstructGPT ، بما في ذلك العصف الذهني، والتصنيف، ضمان الجودة المغلق، والتوليد، واستخراج المعلومات، وضمان الجودة المفتوحة، والتلخيص.
يمكن استخدام مجموعة البيانات هذه لأي غرض، سواء كان أكاديميًا أو تجاريًا، بموجب شروط Creative Commons Attribution-ShareAlike 3.0 Unported License .
الصفحة الرئيسية : https://github.com/databrickslabs/dolly
كود المصدر :
tfds.datasets.databricks_dolly.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
12.60 MiB
حجم مجموعة البيانات :
12.69 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 15,014 |
- هيكل الميزة :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
فئة | نص | خيط | ||
سياق | نص | خيط | ||
تعليمات | نص | خيط | ||
إجابة | نص | خيط |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :