- Mô tả :
databricks-dolly-15k
là tập dữ liệu nguồn mở gồm các bản ghi tuân theo hướng dẫn được sử dụng trong đào tạo databricks/dolly-v2-12b được tạo bởi hàng nghìn nhân viên của Databricks trong một số danh mục hành vi được nêu trong bài báo InstructGPT , bao gồm động não, phân loại, QA đóng, tạo, trích xuất thông tin, QA mở và tóm tắt.
Tập dữ liệu này có thể được sử dụng cho bất kỳ mục đích nào, dù là học thuật hay thương mại, theo các điều khoản của Giấy phép Creative Commons Ghi công-Chia sẻ tương tự 3.0 Chưa chuyển đổi .
Trang chủ : https://github.com/databrickslabs/dolly
Mã nguồn :
tfds.datasets.databricks_dolly.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Kích thước tải xuống :
12.60 MiB
Kích thước tập dữ liệu :
12.69 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 15.014 |
- Cấu trúc tính năng :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
loại | Chữ | sợi dây | ||
bối cảnh | Chữ | sợi dây | ||
chỉ dẫn | Chữ | sợi dây | ||
phản ứng | Chữ | sợi dây |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn :