xtreme_s

  • توضیحات :

FLEURS نسخه گفتاری معیار ترجمه ماشینی FLORES است که 2000 جمله موازی n-way در 102 زبان را پوشش می دهد. XTREME-S چهار خانواده وظیفه را پوشش می دهد: تشخیص گفتار، طبقه بندی، ترجمه گفتار به متن و بازیابی. XTREME-S با پوشش 102 زبان از بیش از 10 خانواده زبان، 3 حوزه مختلف و 4 خانواده وظیفه، با هدف ساده‌سازی ارزیابی بازنمایی گفتار چندزبانه، و همچنین تسریع تحقیقات در یادگیری بازنمایی گفتار «جهانی» است.

در این نسخه، تنها مجموعه داده FLEURS ارائه شده است که تشخیص گفتار و ترجمه گفتار به متن را پوشش می دهد.

  • توضیحات پیکربندی : FLEURS نسخه گفتاری معیار ترجمه ماشینی FLORES است که 2000 جمله موازی n-way در 102 زبان را پوشش می دهد.

  • صفحه اصلی : https://arxiv.org/abs/2205.12446

  • کد منبع : tfds.audio.xtreme_s.XtremeS

  • نسخه ها :

    • 2.0.0 (پیش‌فرض): انتشار اولیه در TFDS، فقط FLEURS. نام‌گذاری شده برای مطابقت با نسخه 2.0.0 در huggingface که دارای همان داده‌های FLEURS است ( https://huggingface.co/datasets/google/xtreme_s ).
  • ذخیره خودکار ( اسناد ): خیر

  • ساختار ویژگی :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'gender': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'id': Scalar(shape=(), dtype=int32, description=Source text identifier, consistent across all languages to keep n-way parallelism of translations. Since each transcription may be spoken by multiple speakers, within each language multiple examples will also share the same id.),
    'lang_group_id': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'lang_id': ClassLabel(shape=(), dtype=int64, num_classes=102),
    'language': Text(shape=(), dtype=string),
    'num_samples': Scalar(shape=(), dtype=int32, description=Total number of frames in the audio),
    'path': string,
    'raw_transcription': Text(shape=(), dtype=string),
    'transcription': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D توضیحات
FeaturesDict
صوتی صوتی (هیچ،) int64
جنسیت ClassLabel int64
شناسه اسکالر int32 شناسه متن مبدأ، سازگار در همه زبان‌ها برای حفظ موازی‌سازی ترجمه‌ها. از آنجایی که هر رونویسی ممکن است توسط چندین گوینده صحبت شود، در هر زبان چندین مثال نیز شناسه یکسانی دارند.
lang_group_id ClassLabel int64
lang_id ClassLabel int64
زبان متن رشته زبان به صورت حروف کوچک و نسخه جدا شده با زیرخط یک برچسب BCP-47 کدگذاری شده است.
num_samples اسکالر int32 تعداد کل فریم های صوتی
مسیر تانسور رشته
raw_transcription متن رشته رونویسی خام از FLoRes.
رونویسی متن رشته رونویسی عادی
  • کلیدهای تحت نظارت (به as_supervised مراجعه کنید): ('audio', 'transcription')

  • شکل ( tfds.show_examples ): پشتیبانی نمی شود.

  • نقل قول :

@article{fleurs2022arxiv,
  title = {FLEURS: Few-shot Learning Evaluation of Universal Representations of Speech},
  author = {Conneau, Alexis and Ma, Min and Khanuja, Simran and Zhang, Yu and Axelrod, Vera and Dalmia, Siddharth and Riesa, Jason and Rivera, Clara and Bapna, Ankur},
  journal={arXiv preprint arXiv:2205.12446},
  url = {https://arxiv.org/abs/2205.12446},
  year = {2022},
}
@article{conneau2022xtreme,
  title={XTREME-S: Evaluating Cross-lingual Speech Representations},
  author={Conneau, Alexis and Bapna, Ankur and Zhang, Yu and Ma, Min and von Platen, Patrick and Lozhkov, Anton and Cherry, Colin and Jia, Ye and Rivera, Clara and Kale, Mihir and others},
  journal={arXiv preprint arXiv:2203.10752},
  year={2022}
}

xtreme_s/fleurs.af_za (پیکربندی پیش فرض)

  • حجم دانلود : 877.09 MiB

  • حجم مجموعه داده : 1.91 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 264
'train' 1032
'validation' 198

xtreme_s/fleurs.am_et

  • حجم دانلود : 2.18 GiB

  • حجم مجموعه داده : 4.92 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 516
'train' 3,163
'validation' 223

xtreme_s/fleurs.ar_eg

  • حجم دانلود : 1.42 GiB

  • حجم مجموعه داده : 3.06 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 428
'train' 2,104
'validation' 295

xtreme_s/fleurs.as_in

  • حجم دانلود : 2.67 GiB

  • حجم مجموعه داده : 5.73 GiB

  • تقسیم ها :

تقسیم کنید نمونه ها
'test' 984
'train' 2,812
'validation' 418

xtreme_s/fleurs.ast_es

  • حجم دانلود : 1.90 GiB

  • حجم مجموعه داده : 4.03 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 946
'train' 2511
'validation' 398

xtreme_s/fleurs.az_az

  • حجم دانلود : 2.28 GiB

  • حجم مجموعه داده : 5.08 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 923
'train' 2665
'validation' 400

xtreme_s/fleurs.be_by

  • حجم دانلود : 2.45 GiB

  • حجم مجموعه داده : 5.53 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 967
'train' 2,433
'validation' 408

xtreme_s/fleurs.bg_bg

  • حجم دانلود : 2.11 GiB

  • حجم مجموعه داده : 4.61 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 658
'train' 2,973
'validation' 395

xtreme_s/fleurs.bn_in

  • حجم دانلود : 2.77 GiB

  • حجم مجموعه داده : 5.84 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 920
'train' 3006
'validation' 402

xtreme_s/fleurs.bs_ba

  • حجم دانلود : 2.32 GiB

  • حجم مجموعه داده : 5.23 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 925
'train' 3,091
'validation' 400

xtreme_s/fleurs.ca_es

  • حجم دانلود : 2.01 GiB

  • حجم مجموعه داده : 4.32 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 940
'train' 2300
'validation' 404

xtreme_s/fleurs.ceb_ph

  • حجم دانلود : 2.63 GiB

  • حجم مجموعه داده : 5.65 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 541
'train' 3,261
'validation' 225

xtreme_s/fleurs.ckb_iq

  • حجم دانلود : 2.46 GiB

  • حجم مجموعه داده : 5.34 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 922
'train' 3,040
'validation' 386

xtreme_s/fleurs.cmn_hans_cn

  • حجم دانلود : 2.35 GiB

  • حجم مجموعه داده : 5.12 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 945
'train' 3,246
'validation' 409

xtreme_s/fleurs.cs_cz

  • حجم دانلود : 1.93 GiB

  • حجم مجموعه داده : 4.32 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 723
'train' 2811
'validation' 305

xtreme_s/fleurs.cy_gb

  • حجم دانلود : 2.90 GiB

  • حجم مجموعه داده : 6.62 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1021
'train' 3,427
'validation' 447

xtreme_s/fleurs.da_dk

  • حجم دانلود : 1.82 GiB

  • حجم مجموعه داده : 4.17 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 930
'train' 2,465
'validation' 395

xtreme_s/fleurs.de_de

  • حجم دانلود : 2.25 GiB

  • حجم مجموعه داده : 4.88 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 862
'train' 2,987
'validation' 363

xtreme_s/fleurs.el_gr

  • حجم دانلود : 2.24 GiB

  • حجم مجموعه داده : 4.73 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 650
'train' 3,215
'validation' 271

xtreme_s/fleurs.en_us

  • حجم دانلود : 1.72 GiB

  • حجم مجموعه داده : 3.76 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 647
'train' 2602
'validation' 394

xtreme_s/fleurs.es_419

  • حجم دانلود : 2.14 GiB

  • حجم مجموعه داده : 4.80 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 908
'train' 2796
'validation' 408

xtreme_s/fleurs.et_ee

  • حجم دانلود : 1.88 GiB

  • حجم مجموعه داده : 4.20 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 893
'train' 2501
'validation' 387

xtreme_s/fleurs.fa_ir

  • حجم دانلود : 2.87 GiB

  • حجم مجموعه داده : 6.34 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 871
'train' 3,101
'validation' 369

xtreme_s/fleurs.ff_sn

  • حجم دانلود : 2.93 GiB

  • حجم مجموعه داده : 6.54 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 660
'train' 3,235
'validation' 273

xtreme_s/fleurs.fi_fi

  • حجم دانلود : 2.21 GiB

  • حجم مجموعه داده : 4.92 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 918
'train' 2704
'validation' 415

xtreme_s/fleurs.fil_ph

  • حجم دانلود : 2.47 GiB

  • حجم مجموعه داده : 5.38 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 964
'train' 1884
'validation' 418

xtreme_s/fleurs.fr_fr

  • حجم دانلود : 2.08 GiB

  • حجم مجموعه داده : 4.73 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 676
'train' 3,193
'validation' 289

xtreme_s/fleurs.ga_ie

  • حجم دانلود : 2.78 GiB

  • حجم مجموعه داده : 6.24 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 842
'train' 2,845
'validation' 369

xtreme_s/fleurs.gl_es

  • حجم دانلود : 1.79 GiB

  • حجم مجموعه داده : 3.87 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 927
'train' 2175
'validation' 395

xtreme_s/fleurs.gu_in

  • حجم دانلود : 2.33 GiB

  • حجم مجموعه داده : 4.97 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1000
'train' 3,145
'validation' 432

xtreme_s/fleurs.ha_ng

  • حجم دانلود : 3.14 GiB

  • حجم مجموعه داده : 6.84 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 621
'train' 3,259
'validation' 296

xtreme_s/fleurs.he_il

  • حجم دانلود : 2.22 GiB

  • حجم مجموعه داده : 4.60 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 792
'train' 3,242
'validation' 328

xtreme_s/fleurs.hi_in

  • حجم دانلود : 1.53 GiB

  • حجم مجموعه داده : 3.27 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 418
'train' 2120
'validation' 239

xtreme_s/fleurs.hr_hr

  • حجم دانلود : 2.40 GiB

  • حجم مجموعه داده : 5.54 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 914
'train' 3,461
'validation' 377

xtreme_s/fleurs.hu_hu

  • حجم دانلود : 2.33 GiB

  • حجم مجموعه داده : 5.07 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 905
'train' 3,095
'validation' 407

xtreme_s/fleurs.hy_am

  • حجم دانلود : 2.30 GiB

  • حجم مجموعه داده : 5.23 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 932
'train' 3,053
'validation' 395

xtreme_s/fleurs.id_id

  • حجم دانلود : 2.21 GiB

  • حجم مجموعه داده : 4.69 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 687
'train' 2579
'validation' 350

xtreme_s/fleurs.ig_ng

  • حجم دانلود : 3.32 GiB

  • حجم مجموعه داده : 7.44 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 969
'train' 2,839
'validation' 413

xtreme_s/fleurs.is_is

  • حجم دانلود : 559.65 MiB

  • حجم مجموعه داده : 1.16 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 46
'train' 926
'validation' 36

xtreme_s/fleurs.it_it

  • حجم دانلود : 2.41 GiB

  • حجم مجموعه داده : 5.19 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 865
'train' 3,030
'validation' 391

xtreme_s/fleurs.ja_jp

  • حجم دانلود : 1.83 GiB

  • حجم مجموعه داده : 3.94 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 650
'train' 2292
'validation' 266

xtreme_s/fleurs.jv_id

  • حجم دانلود : 2.68 GiB

  • حجم مجموعه داده : 5.62 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 728
'train' 3,051
'validation' 295

xtreme_s/fleurs.ka_ge

  • حجم دانلود : 1.50 GiB

  • حجم مجموعه داده : 3.37 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 979
'train' 1,491
'validation' 409

xtreme_s/fleurs.kam_ke

  • حجم دانلود : 3.43 GiB

  • حجم مجموعه داده : 7.37 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 827
'train' 3,340
'validation' 338

xtreme_s/fleurs.kea_cv

  • حجم دانلود : 2.55 GiB

  • حجم مجموعه داده : 5.57 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 864
'train' 2715
'validation' 366

xtreme_s/fleurs.kk_kz

  • حجم دانلود : 2.69 GiB

  • حجم مجموعه داده : 6.24 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 856
'train' 3200
'validation' 369

xtreme_s/fleurs.km_kh

  • حجم دانلود : 1.88 GiB

  • حجم مجموعه داده : 4.26 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 771
'train' 1675
'validation' 326

xtreme_s/fleurs.kn_in

  • حجم دانلود : 2.26 GiB

  • حجم مجموعه داده : 4.81 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 838
'train' 2283
'validation' 368

xtreme_s/fleurs.ko_kr

  • حجم دانلود : 1.65 GiB

  • حجم مجموعه داده : 3.67 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 382
'train' 2,307
'validation' 226

xtreme_s/fleurs.ky_kg

  • حجم دانلود : 2.18 GiB

  • حجم مجموعه داده : 5.13 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 977
'train' 2,818
'validation' 422

xtreme_s/fleurs.lb_lu

  • حجم دانلود : 1.94 GiB

  • حجم مجموعه داده : 4.39 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 934
'train' 2502
'validation' 408

xtreme_s/fleurs.lg_ug

  • حجم دانلود : 2.83 GiB

  • حجم مجموعه داده : 6.43 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 723
'train' 2,478
'validation' 306

xtreme_s/fleurs.ln_cd

  • حجم دانلود : 3.68 GiB

  • حجم مجموعه داده : 8.13 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 478
'train' 3,350
'validation' 209

xtreme_s/fleurs.lo_la

  • حجم دانلود : 1.61 GiB

  • حجم مجموعه داده : 3.38 GiB

  • تقسیم ها :

تقسیم کنید نمونه ها
'test' 405
'train' 1,809
'validation' 191

xtreme_s/fleurs.lt_lt

  • حجم دانلود : 2.24 GiB

  • حجم مجموعه داده : 5.03 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 986
'train' 2,937
'validation' 416

xtreme_s/fleurs.luo_ke

  • حجم دانلود : 1.87 GiB

  • حجم مجموعه داده : 4.18 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 256
'train' 2,384
'validation' 102

xtreme_s/fleurs.lv_lv

  • حجم دانلود : 1.74 GiB

  • حجم مجموعه داده : 3.84 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 851
'train' 2,110
'validation' 356

xtreme_s/fleurs.mi_nz

  • حجم دانلود : 4.45 GiB

  • حجم مجموعه داده : 9.67 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1008
'train' 3,249
'validation' 429

xtreme_s/fleurs.mk_mk

  • حجم دانلود : 1.91 GiB

  • حجم مجموعه داده : 4.23 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 973
'train' 2,337
'validation' 415

xtreme_s/fleurs.ml_in

  • حجم دانلود : 2.68 GiB

  • حجم مجموعه داده : 5.80 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 958
'train' 3,043
'validation' 418

xtreme_s/fleurs.mn_mn

  • حجم دانلود : 2.21 GiB

  • حجم مجموعه داده : 5.47 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 949
'train' 3,074
'validation' 405

xtreme_s/fleurs.mr_in

  • حجم دانلود : 3.00 GiB

  • حجم مجموعه داده : 6.41 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1,015
'train' 3,269
'validation' 443

xtreme_s/fleurs.ms_my

  • حجم دانلود : 2.22 GiB

  • حجم مجموعه داده : 4.74 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 749
'train' 2667
'validation' 324

xtreme_s/fleurs.mt_mt

  • حجم دانلود : 2.39 GiB

  • حجم مجموعه داده : 5.37 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 926
'train' 2,895
'validation' 404

xtreme_s/fleurs.my_mm

  • حجم دانلود : 2.85 GiB

  • حجم مجموعه داده : 6.43 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 880
'train' 3,058
'validation' 384

xtreme_s/fleurs.nb_no

  • حجم دانلود : 2.15 GiB

  • حجم مجموعه داده : 4.68 GiB

  • تقسیم ها :

تقسیم کنید نمونه ها
'test' 357
'train' 3,167
'validation' 163

xtreme_s/fleurs.ne_np

  • حجم دانلود : 2.47 GiB

  • حجم مجموعه داده : 5.39 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 726
'train' 3,332
'validation' 305

xtreme_s/fleurs.nl_nl

  • حجم دانلود : 1.56 GiB

  • حجم مجموعه داده : 3.33 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 364
'train' 2,918
'validation' 171

xtreme_s/fleurs.nso_za

  • حجم دانلود : 3.27 GiB

  • حجم مجموعه داده : 7.11 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 790
'train' 1990
'validation' 363

xtreme_s/fleurs.ny_mw

  • حجم دانلود : 2.60 GiB

  • حجم مجموعه داده : 5.76 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 761
'train' 2694
'validation' 311

xtreme_s/fleurs.oc_fr

  • حجم دانلود : 3.52 GiB

  • حجم مجموعه داده : 7.43 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 998
'train' 3,379
'validation' 427

xtreme_s/fleurs.om_et

  • حجم دانلود : 1.18 GiB

  • حجم مجموعه داده : 2.52 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 41
'train' 1701
'validation' 19

xtreme_s/fleurs.or_in

  • حجم دانلود : 1.31 GiB

  • حجم مجموعه داده : 2.79 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 883
'train' 1081
'validation' 392

xtreme_s/fleurs.pa_in

  • حجم دانلود : 1.58 GiB

  • حجم مجموعه داده : 3.34 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 574
'train' 1,923
'validation' 251

xtreme_s/fleurs.pl_pl

  • حجم دانلود : 1.95 GiB

  • حجم مجموعه داده : 4.39 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 758
'train' 2,841
'validation' 338

xtreme_s/fleurs.ps_af

  • حجم دانلود : 1.89 GiB

  • حجم مجموعه داده : 4.20 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 512
'train' 2513
'validation' 217

xtreme_s/fleurs.pt_br

  • حجم دانلود : 2.50 GiB

  • حجم مجموعه داده : 5.43 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 919
'train' 2793
'validation' 386

xtreme_s/fleurs.ro_ro

  • حجم دانلود : 2.39 GiB

  • حجم مجموعه داده : 5.09 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 883
'train' 2,891
'validation' 387

xtreme_s/fleurs.ru_ru

  • حجم دانلود : 1.92 GiB

  • حجم مجموعه داده : 4.25 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 775
'train' 2,562
'validation' 356

xtreme_s/fleurs.sd_in

  • حجم دانلود : 3.00 GiB

  • حجم مجموعه داده : 6.35 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 980
'train' 3,443
'validation' 426

xtreme_s/fleurs.sk_sk

  • حجم دانلود : 1.55 GiB

  • حجم مجموعه داده : 3.46 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 792
'train' 1,957
'validation' 352

xtreme_s/fleurs.sl_si

  • حجم دانلود : 1.74 GiB

  • حجم مجموعه داده : 4.00 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 834
'train' 2,512
'validation' 349

xtreme_s/fleurs.sn_zw

  • حجم دانلود : 2.51 GiB

  • حجم مجموعه داده : 5.61 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 925
'train' 2,463
'validation' 393

xtreme_s/fleurs.so_so

  • حجم دانلود : 3.13 GiB

  • حجم مجموعه داده : 6.93 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1019
'train' 3,149
'validation' 432

xtreme_s/fleurs.sr_rs

  • حجم دانلود : 2.36 GiB

  • حجم مجموعه داده : 5.04 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 700
'train' 2,944
'validation' 290

xtreme_s/fleurs.sv_se

  • حجم دانلود : 1.95 GiB

  • حجم مجموعه داده : 4.21 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 759
'train' 2,385
'validation' 330

xtreme_s/fleurs.sw_ke

  • حجم دانلود : 2.70 GiB

  • حجم مجموعه داده : 5.98 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 487
'train' 3070
'validation' 211

xtreme_s/fleurs.ta_in

  • حجم دانلود : 2.13 GiB

  • حجم مجموعه داده : 4.50 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 591
'train' 2,367
'validation' 377

xtreme_s/fleurs.te_in

  • حجم دانلود : 1.81 GiB

  • حجم مجموعه داده : 3.86 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 472
'train' 2,302
'validation' 311

xtreme_s/fleurs.tg_tj

  • حجم دانلود : 1.79 GiB

  • حجم مجموعه داده : 4.26 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 600
'train' 2298
'validation' 240

xtreme_s/fleurs.th_th

  • حجم دانلود : 2.24 GiB

  • حجم مجموعه داده : 4.91 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1021
'train' 2602
'validation' 439

xtreme_s/fleurs.tr_tr

  • حجم دانلود : 1.99 GiB

  • حجم مجموعه داده : 4.36 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 743
'train' 2,526
'validation' 338

xtreme_s/fleurs.uk_ua

  • حجم دانلود : 2.01 GiB

  • حجم مجموعه داده : 4.44 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 750
'train' 2,810
'validation' 325

xtreme_s/fleurs.umb_ao

  • حجم دانلود : 2.58 GiB

  • حجم مجموعه داده : 5.55 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 379
'train' 1597
'validation' 135

xtreme_s/fleurs.ur_pk

  • حجم دانلود : 1.42 GiB

  • حجم مجموعه داده : 3.13 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 299
'train' 2,109
'validation' 267

xtreme_s/fleurs.uz_uz

  • حجم دانلود : 2.33 GiB

  • حجم مجموعه داده : 5.18 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 862
'train' 2,943
'validation' 363

xtreme_s/fleurs.vi_vn

  • حجم دانلود : 2.21 GiB

  • حجم مجموعه داده : 4.88 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 857
'train' 2994
'validation' 361

xtreme_s/fleurs.wo_sn

  • حجم دانلود : 1.71 GiB

  • حجم مجموعه داده : 3.86 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 371
'train' 2279
'validation' 169

xtreme_s/fleurs.xh_za

  • حجم دانلود : 2.86 GiB

  • حجم مجموعه داده : 6.80 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 1041
'train' 3,466
'validation' 446

xtreme_s/fleurs.yo_ng

  • حجم دانلود : 2.65 GiB

  • حجم مجموعه داده : 5.78 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 831
'train' 2,339
'validation' 378

xtreme_s/fleurs.yue_hant_hk

  • حجم دانلود : 1.86 GiB

  • حجم مجموعه داده : 4.06 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 819
'train' 1,939
'validation' 362
  • مثال‌ها ( tfds.as_dataframe ): فقط برای 100 پیکربندی اول نشان داده می‌شود.

xtreme_s/fleurs.zu_za

  • حجم دانلود : 3.15 GiB

  • حجم مجموعه داده : 7.27 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 854
'train' 2,858
'validation' 354
  • مثال‌ها ( tfds.as_dataframe ): فقط برای 100 پیکربندی اول نشان داده می‌شود.

xtreme_s/fleurs.all

  • حجم دانلود : 231.36 GiB

  • حجم مجموعه داده : 509.51 GiB

  • تقسیمات :

تقسیم کنید نمونه ها
'test' 77,810
'train' 271798
'validation' 34,452
  • مثال‌ها ( tfds.as_dataframe ): فقط برای 100 پیکربندی اول نشان داده می‌شود.