- Açıklama :
Belirgin açıklıklar etiketli Wikipedia cümleleri.
Ana Sayfa : https://www.tensorflow.org/datasets/catalog/salient_span_wikipedia
Kaynak kodu :
tfds.datasets.salient_span_wikipedia.Buildersürümler :
-
1.0.0(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
Unknown sizeOtomatik önbelleğe alınmış ( belgeleme ): Hayır
Denetlenen anahtarlar (Bkz
as_superviseddoc ):NoneŞekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{guu2020realm,
title={REALM: Retrieval-Augmented Language Model Pre-Training},
author={Kelvin Guu and Kenton Lee and Zora Tung and Panupong Pasupat and Ming-Wei Chang},
year={2020},
journal = {arXiv e-prints},
archivePrefix = {arXiv},
eprint={2002.08909},
}
salient_span_wikipedia/sentences (varsayılan yapılandırma)
Yapılandırma açıklaması : Örnekler, varlıkları içeren bireysel cümlelerdir.
Veri kümesi boyutu :
20.57 GiBbölmeler :
| Bölmek | örnekler |
|---|---|
'train' | 82.291.706 |
- Özellik yapısı :
FeaturesDict({
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Açıklama |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| açıklıklar | Sıra | |||
| aralıklar/sınır | tensör | int32 | ||
| açıklıklar/başlangıç | tensör | int32 | ||
| yayılma/tür | tensör | sicim | ||
| metin | Metin | sicim | ||
| Başlık | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):
salient_span_wikipedia/belgeler
Yapılandırma açıklaması : Örnekler tam belgelerdir.
Veri kümesi boyutu :
16.52 GiBbölmeler :
| Bölmek | örnekler |
|---|---|
'train' | 13.353.718 |
- Özellik yapısı :
FeaturesDict({
'sentences': Sequence({
'limit': int32,
'start': int32,
}),
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Açıklama |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| cümleler | Sıra | |||
| cümleler/sınır | tensör | int32 | ||
| cümleler/başlangıç | tensör | int32 | ||
| açıklıklar | Sıra | |||
| aralıklar/sınır | tensör | int32 | ||
| açıklıklar/başlangıç | tensör | int32 | ||
| yayılma/tür | tensör | sicim | ||
| metin | Metin | sicim | ||
| Başlık | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):