- Açıklama :
WikiDialog, sentetik olarak oluşturulmuş bilgi arama konuşmalarından oluşan geniş bir veri kümesidir. Veri kümesindeki her konuşma, İngilizce Vikipedi'den bir pasaja dayanan iki konuşmacı içerir: bir konuşmacının sözleri, pasajdaki kesin cümlelerden oluşur; diğer konuşmacı, büyük bir dil modeli tarafından üretilir.
Yapılandırma açıklaması : OR-QuAC ve QReCC'de ince ayarı yapılan inpainter iletişim kutusundan oluşturulan WikiDialog.
OQ
, OR-QuAC ve QReCC'nin kısaltmasıdır.Ana sayfa : https://github.com/google-research/dialog-inpainting#wikidialog-oq
Kaynak kodu :
tfds.text.wiki_dialog.WikiDialog
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
7.04 GiB
Veri kümesi boyutu :
36.58 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 11.264.129 |
'validation' | 113.822 |
- Özellik yapısı :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
yazar_sayısı | Sıra(Tensor) | (Hiçbiri,) | int32 | |
geçit | Metin | sicim | ||
pid | Metin | sicim | ||
cümleler | Sıra(Metin) | (Hiçbiri,) | sicim | |
Başlık | Metin | sicim | ||
sözler | Sıra(Metin) | (Hiçbiri,) | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}