dörtlü

  • Açıklama :

XQuAD (Diller Arası Soru Cevaplama Veri Kümesi), diller arası soru yanıtlama performansını değerlendirmek için bir kıyaslama veri kümesidir. Veri seti, SQuAD v1.1 geliştirme setinden (Rajpurkar ve diğerleri, 2016) 240 paragraflık bir alt küme ve 1190 soru-cevap çiftinden ve bunların on dile profesyonel çevirilerinden oluşur: İspanyolca, Almanca, Yunanca, Rusça, Türkçe , Arapça, Vietnamca, Tayca, Çince ve Hintçe. Sonuç olarak, veri kümesi 11 dilde tamamen paraleldir. XQuAD'i varsayılan sıfır atış ayarında çalıştırmak için SQuAD v1.1 eğitim ve doğrulama verilerini burada kullanın: https://www.tensorflow.org/datasets/catalog/squad

Ayrıca XTREME'den İngilizce olmayan her dil için "translate-train", "translate-dev" ve "translate-test" bölümlerini de dahil ediyoruz (Hu ve diğerleri, 2020). Bunlar, XQuAD'i "translate-train" veya "translate-test" ayarlarında çalıştırmak için kullanılabilir.

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
Yanıtlar Sekans
cevaplar/cevap_başlangıç tensör int32
cevaplar/metin Metin sicim
bağlam Metin sicim
İD tensör sicim
soru Metin sicim
Başlık Metin sicim
@article{Artetxe:etal:2019,
      author    = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
      title     = {On the cross-lingual transferability of monolingual representations},
      journal   = {CoRR},
      volume    = {abs/1910.11856},
      year      = {2019},
      archivePrefix = {arXiv},
      eprint    = {1910.11856}
}

xquad/ar (varsayılan yapılandırma)

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'ar' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 420.97 MiB

  • Veri kümesi boyutu : 134.83 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.541
'translate-test' 1.151
'translate-train' 86.787

xquad/de

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'de' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 127.04 MiB

  • Veri kümesi boyutu : 98.80 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.371
'translate-test' 1.168
'translate-train' 82.603

xquad/el

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'el' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 499.40 MiB

  • Veri kümesi boyutu : 157.90 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.100
'translate-test' 1.182
'translate-train' 79.946

xquad/es

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'es' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 138.41 MiB

  • Veri kümesi boyutu : 104.96 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.566
'translate-test' 1.188
'translate-train' 87.488

xquad/merhaba

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'hi' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 472.23 MiB

  • Veri kümesi boyutu : 207.85 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.536
'translate-test' 1.184
'translate-train' 85.804

xquad/ru

  • Yapılandırma açıklaması : XQuAD 'ru' test bölümü, XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle (Hu ve diğerleri, 2020).

  • İndirme boyutu : 513.80 MiB

  • Veri kümesi boyutu : 159.38 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.469
'translate-test' 1.190
'translate-train' 84.869

xdört/th

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "th" test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 461.54 MiB

  • Veri kümesi boyutu : 199.57 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca shuffle_files=False (translate-train) olduğunda

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.516
'translate-test' 1.157
'translate-train' 85.846

xquad/tr

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "tr" test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 151.08 MiB

  • Veri kümesi boyutu : 97.56 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.535
'translate-test' 1.112
'translate-train' 86.511

xquad/vi

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'vi' test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 218.09 MiB

  • Veri kümesi boyutu : 120.03 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.555
'translate-test' 1.178
'translate-train' 87.187

xquad/zh

  • Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "zh" test bölümü (Hu ve diğerleri, 2020).

  • İndirme boyutu : 174.57 MiB

  • Veri kümesi boyutu : 80.79 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190
'translate-dev' 10.475
'translate-test' 1.186
'translate-train' 85.700

xquad/tr

  • Yapılandırma açıklaması : XQuAD 'en' test bölümü.

  • İndirme boyutu : 595.10 KiB

  • Veri kümesi boyutu : 1.19 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 1.190