- Deskripsi :
Kumpulan data dijelaskan dalam makalah: Instruksi Tidak Alami: Model Bahasa Tuning dengan (Hampir) Tanpa Tenaga Kerja Manusia (2022). Berisi rangkaian instruksi bahasa alami, dengan batasan opsional/formulasi ulang yang dihasilkan LLM.
Beranda : https://github.com/orhonovich/unnatural-instructions
Kode sumber :
tfds.text.unnatural_instructions.UnnaturalInstructions
Versi :
-
0.0.1
(default): Rilis awal. Abaikan instruksi / input, karena membutuhkan pemrosesan tambahan untuk digunakan. Instruction_with_inputs dan formulasi ulang berisi instruksi dan konteks.
-
Ukuran unduhan :
17.48 MiB
Ukuran dataset :
154.71 MiB
Auto-cached ( dokumentasi ): Hanya ketika
shuffle_files=False
(train)Perpecahan :
Membelah | Contoh |
---|---|
'train' | 66.010 |
- Struktur fitur :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Indo | Teks | rangkaian | Pengidentifikasi unik misalnya. | |
contoh | Urutan | |||
contoh/batasan | Teks | rangkaian | Batasan khusus tugas. | |
contoh/masukan | Teks | rangkaian | Masukan untuk dimasukkan ke placeholder untuk instruksi yang diberikan. | |
instance/instruction_with_input | Teks | rangkaian | Instruksi dengan input yang diberikan ke placeholder. | |
contoh/keluaran | Teks | rangkaian | Output target untuk tugas yang diberikan. | |
petunjuk | Teks | rangkaian | Instruksi dengan placeholder untuk input. | |
reformulasi | Urutan | |||
formulasi/input | Teks | rangkaian | Masukan untuk dimasukkan ke placeholder untuk instruksi yang diberikan. | |
reformulasi/instruksi | Teks | rangkaian | Instruksi dengan placeholder untuk input. | |
reformulasi/instruksi_dengan_input | Teks | rangkaian | Instruksi dengan input yang diberikan ke placeholder. | |
reformulasi/output | Teks | rangkaian | Output target untuk tugas yang diberikan. |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}