wiki_dialog

  • Açıklama :

WikiDialog, sentetik olarak oluşturulmuş bilgi arama konuşmalarından oluşan geniş bir veri kümesidir. Veri kümesindeki her konuşma, İngilizce Vikipedi'den bir pasaja dayanan iki konuşmacı içerir: bir konuşmacının sözleri, pasajdaki kesin cümlelerden oluşur; diğer konuşmacı, büyük bir dil modeli tarafından üretilir.

Bölmek örnekler
'train' 11.264.129
'validation' 113.822
  • Özellik yapısı :
FeaturesDict({
    'author_num': Sequence(int32),
    'passage': Text(shape=(), dtype=string),
    'pid': Text(shape=(), dtype=string),
    'sentences': Sequence(Text(shape=(), dtype=string)),
    'title': Text(shape=(), dtype=string),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
yazar_sayısı Sıra(Tensor) (Hiçbiri,) int32
geçit Metin sicim
pid Metin sicim
cümleler Sıra(Metin) (Hiçbiri,) sicim
Başlık Metin sicim
sözler Sıra(Metin) (Hiçbiri,) sicim
  • Alıntı :
@inproceedings{dai2022dialoginpainting,
  title={Dialog Inpainting: Turning Documents to Dialogs},
  author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
  booktitle={International Conference on Machine Learning (ICML)},
  year={2022},
  organization={PMLR}
}

wiki_dialog/OQ (varsayılan yapılandırma)