- Açıklama :
WikiBio, Wikipedia biyografi sayfaları kullanılarak oluşturulmuştur, ilk paragrafı ve belirtilmiş bilgi kutusunu içerir. Veri kümesi, standartlaştırılmış bir tablo biçimini izler.
Ana Sayfa : https://github.com/DavidGrangier/wikipedia-biography-dataset
Kaynak kodu :
tfds.structured.WikiBio
sürümler :
-
0.1.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
318.53 MiB
Veri kümesi boyutu :
795.98 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 72.831 |
'train' | 582.659 |
'validation' | 72.831 |
- Özellik yapısı :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
giriş metni | ÖzelliklerDict | |||
girdi_metni/bağlam | tensör | sicim | ||
girdi_metni/tablo | Sekans | |||
girdi_metni/tablo/sütun_başlığı | tensör | sicim | ||
girdi_metni/tablo/içerik | tensör | sicim | ||
girdi_metni/tablo/satır_numarası | tensör | int16 | ||
hedef_metin | tensör | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):('input_text', 'target_text')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@inproceedings{lebret-etal-2016-neural,
title = "Neural Text Generation from Structured Data with Application to the Biography Domain",
author = "Lebret, R{'e}mi and
Grangier, David and
Auli, Michael",
booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2016",
address = "Austin, Texas",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/D16-1128",
doi = "10.18653/v1/D16-1128",
pages = "1203--1213",
}