databricks_dolly

  • الوصف :

databricks-dolly-15k عبارة عن مجموعة بيانات مفتوحة المصدر لسجلات متابعة التعليمات المستخدمة في تدريب databricks/dolly-v2-12b والتي تم إنشاؤها بواسطة الآلاف من موظفي Databricks في العديد من الفئات السلوكية الموضحة في ورقة InstructGPT ، بما في ذلك العصف الذهني، والتصنيف، ضمان الجودة المغلق، والتوليد، واستخراج المعلومات، وضمان الجودة المفتوحة، والتلخيص.

يمكن استخدام مجموعة البيانات هذه لأي غرض، سواء كان أكاديميًا أو تجاريًا، بموجب شروط Creative Commons Attribution-ShareAlike 3.0 Unported License .

ينقسم أمثلة
'train' 15,014
  • هيكل الميزة :
FeaturesDict({
    'category': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'response': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
فئة نص خيط
سياق نص خيط
تعليمات نص خيط
إجابة نص خيط
  • الاقتباس :