- คำอธิบาย :
databricks-dolly-15k
เป็นชุดข้อมูลโอเพ่นซอร์สของบันทึกการปฏิบัติตามคำสั่งที่ใช้ในการฝึกอบรม databricks/dolly-v2-12b ที่สร้างขึ้นโดยพนักงาน Databricks หลายพันคนในหมวดหมู่พฤติกรรมหลายประเภทที่ระบุไว้ในรายงาน InstructGPT รวมถึงการระดมความคิด การจำแนกประเภท QA แบบปิด การสร้าง การดึงข้อมูล QA แบบเปิด และการสรุป
ชุดข้อมูลนี้สามารถใช้เพื่อวัตถุประสงค์ใดก็ได้ ไม่ว่าจะเป็นเชิงวิชาการหรือเชิงพาณิชย์ ภายใต้เงื่อนไขของ Creative Commons Attribution-ShareAlike 3.0 Unported License
หน้าแรก : https://github.com/databrickslabs/dolly
ซอร์สโค้ด :
tfds.datasets.databricks_dolly.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดดาวน์โหลด :
12.60 MiB
ขนาดชุดข้อมูล :
12.69 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 15,014 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
หมวดหมู่ | ข้อความ | เชือก | ||
บริบท | ข้อความ | เชือก | ||
คำแนะนำ | ข้อความ | เชือก | ||
การตอบสนอง | ข้อความ | เชือก |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :