databricks_dolly

  • Mô tả :

databricks-dolly-15k là tập dữ liệu nguồn mở gồm các bản ghi tuân theo hướng dẫn được sử dụng trong đào tạo databricks/dolly-v2-12b được tạo bởi hàng nghìn nhân viên của Databricks trong một số danh mục hành vi được nêu trong bài báo InstructGPT , bao gồm động não, phân loại, QA đóng, tạo, trích xuất thông tin, QA mở và tóm tắt.

Tập dữ liệu này có thể được sử dụng cho bất kỳ mục đích nào, dù là học thuật hay thương mại, theo các điều khoản của Giấy phép Creative Commons Ghi công-Chia sẻ tương tự 3.0 Chưa chuyển đổi .

Tách ra Ví dụ
'train' 15.014
  • Cấu trúc tính năng :
FeaturesDict({
    'category': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'response': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
loại Chữ sợi dây
bối cảnh Chữ sợi dây
chỉ dẫn Chữ sợi dây
phản ứng Chữ sợi dây
  • Trích dẫn :