تتويبا

  • الوصف :

تم استخراج هذه البيانات من مجموعة تاتويبا ، بتاريخ السبت 2018/11/17.

لكل لغة ، اخترنا 1000 جملة إنجليزية وترجماتها ، إن وجدت. يرجى مراجعة هذه الورقة للحصول على وصف للغات وعائلاتهم ونصوصهم بالإضافة إلى النتائج الأساسية.

يرجى ملاحظة أن الجمل الإنجليزية ليست متطابقة لجميع أزواج اللغات. هذا يعني أن النتائج لا يمكن مقارنتها بشكل مباشر عبر اللغات.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
المصدر_اللغة نص خيط
المصدر نص خيط
الهدف_اللغة نص خيط
target_sentence نص خيط
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba / tatoeba_af (التكوين الافتراضي)

  • حجم التحميل : 58.24 KiB

  • حجم مجموعة البيانات : 162.74 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_ار

  • حجم التحميل : 70.95 KiB

  • حجم مجموعة البيانات : 175.46 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_بج

  • حجم التحميل : 99.88 KiB

  • حجم مجموعة البيانات : 204.64 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبة_بن

  • حجم التحميل : 89.55 KiB

  • حجم مجموعة البيانات : 194.24 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_de

  • حجم التحميل : 103.09 KiB

  • حجم مجموعة البيانات : 207.93 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_el

  • حجم التحميل : 77.11 KiB

  • حجم مجموعة البيانات : 181.65 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_es

  • حجم التحميل : 70.57 KiB

  • حجم مجموعة البيانات : 175.12 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_et

  • حجم التحميل : 58.33 KiB

  • حجم مجموعة البيانات : 162.85 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_eu

  • حجم التحميل : 64.52 KiB

  • حجم مجموعة البيانات : 169.02 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_فا

  • حجم التحميل : 91.52 KiB

  • حجم مجموعة البيانات : 196.15 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_fi

  • حجم التحميل : 73.90 KiB

  • حجم مجموعة البيانات : 178.47 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_فر

  • حجم التحميل : 78.14 KiB

  • حجم مجموعة البيانات : 182.68 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 81.54 KiB

  • حجم مجموعة البيانات : 186.15 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 119.69 KiB

  • حجم مجموعة البيانات : 224.89 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 67.27 KiB

  • حجم مجموعة البيانات : 171.78 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_id

  • حجم التحميل : 73.09 KiB

  • حجم مجموعة البيانات : 177.61 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_يت

  • حجم التحميل : 64.29 KiB

  • حجم مجموعة البيانات : 168.81 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_جا

  • حجم التحميل : 90.90 KiB

  • حجم مجموعة البيانات : 195.53 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_jv

  • حجم التحميل : 13.59 KiB

  • حجم مجموعة البيانات : 35.01 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 205

tatoeba / tatoeba_ka

  • حجم التحميل : 70.47 KiB

  • حجم مجموعة البيانات : 148.67 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 746

تتويبا / تتويبا_كك

  • حجم التحميل : 46.07 KiB

  • حجم مجموعة البيانات : 106.25 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 575

تتويبا / تتويبا_كو

  • حجم التحميل : 77.28 KiB

  • حجم مجموعة البيانات : 181.88 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_ مل

  • حجم التحميل : 92.50 KiB

  • حجم مجموعة البيانات : 165.14 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 687

تتويبا / تتويبا_مر

  • حجم التحميل : 98.19 KiB

  • حجم مجموعة البيانات : 202.96 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_nl

  • حجم التحميل : 71.55 KiB

  • حجم مجموعة البيانات : 176.10 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_pt

  • حجم التحميل : 73.42 KiB

  • حجم مجموعة البيانات : 177.95 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_ru

  • حجم التحميل : 90.30 KiB

  • حجم مجموعة البيانات : 194.92 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_sw

  • حجم التحميل : 19.99 KiB

  • حجم مجموعة البيانات : 60.75 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 390

تتويبا / تتويبا_تا

  • حجم التحميل : 38.52 KiB

  • حجم مجموعة البيانات : 70.93 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 307

تتويبا / تتويبا

  • حجم التحميل : 24.55 KiB

  • حجم مجموعة البيانات : 49.07 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 234

تتويبا / تتويبا

  • حجم التحميل : 61.72 KiB

  • حجم مجموعة البيانات : 119.32 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 548

tatoeba / tatoeba_tl

  • حجم التحميل : 66.54 KiB

  • حجم مجموعة البيانات : 171.04 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_تر

  • حجم التحميل : 70.20 KiB

  • حجم مجموعة البيانات : 174.70 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_ur

  • حجم التحميل : 86.63 KiB

  • حجم مجموعة البيانات : 191.20 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_vi

  • حجم التحميل : 89.26 KiB

  • حجم مجموعة البيانات : 193.89 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_zh

  • حجم التحميل : 67.32 KiB

  • حجم مجموعة البيانات : 171.85 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000
و

  • الوصف :

تم استخراج هذه البيانات من مجموعة تاتويبا ، بتاريخ السبت 2018/11/17.

لكل لغة ، اخترنا 1000 جملة إنجليزية وترجماتها ، إن وجدت. يرجى مراجعة هذه الورقة للحصول على وصف للغات وعائلاتهم ونصوصهم بالإضافة إلى النتائج الأساسية.

يرجى ملاحظة أن الجمل الإنجليزية ليست متطابقة لجميع أزواج اللغات. هذا يعني أن النتائج لا يمكن مقارنتها بشكل مباشر عبر اللغات.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
المصدر_اللغة نص خيط
المصدر نص خيط
الهدف_اللغة نص خيط
target_sentence نص خيط
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba / tatoeba_af (التكوين الافتراضي)

  • حجم التحميل : 58.24 KiB

  • حجم مجموعة البيانات : 162.74 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_ار

  • حجم التحميل : 70.95 KiB

  • حجم مجموعة البيانات : 175.46 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_بج

  • حجم التحميل : 99.88 KiB

  • حجم مجموعة البيانات : 204.64 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبة_بن

  • حجم التحميل : 89.55 KiB

  • حجم مجموعة البيانات : 194.24 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_de

  • حجم التحميل : 103.09 KiB

  • حجم مجموعة البيانات : 207.93 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_el

  • حجم التحميل : 77.11 KiB

  • حجم مجموعة البيانات : 181.65 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_es

  • حجم التحميل : 70.57 KiB

  • حجم مجموعة البيانات : 175.12 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_et

  • حجم التحميل : 58.33 KiB

  • حجم مجموعة البيانات : 162.85 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_eu

  • حجم التحميل : 64.52 KiB

  • حجم مجموعة البيانات : 169.02 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_فا

  • حجم التحميل : 91.52 KiB

  • حجم مجموعة البيانات : 196.15 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_fi

  • حجم التحميل : 73.90 KiB

  • حجم مجموعة البيانات : 178.47 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_فر

  • حجم التحميل : 78.14 KiB

  • حجم مجموعة البيانات : 182.68 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 81.54 KiB

  • حجم مجموعة البيانات : 186.15 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 119.69 KiB

  • حجم مجموعة البيانات : 224.89 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا

  • حجم التحميل : 67.27 KiB

  • حجم مجموعة البيانات : 171.78 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_id

  • حجم التحميل : 73.09 KiB

  • حجم مجموعة البيانات : 177.61 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_يت

  • حجم التحميل : 64.29 KiB

  • حجم مجموعة البيانات : 168.81 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_جا

  • حجم التحميل : 90.90 KiB

  • حجم مجموعة البيانات : 195.53 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_jv

  • حجم التحميل : 13.59 KiB

  • حجم مجموعة البيانات : 35.01 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 205

tatoeba / tatoeba_ka

  • حجم التحميل : 70.47 KiB

  • حجم مجموعة البيانات : 148.67 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 746

تتويبا / تتويبا_كك

  • حجم التحميل : 46.07 KiB

  • حجم مجموعة البيانات : 106.25 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 575

تتويبا / تتويبا_كو

  • حجم التحميل : 77.28 KiB

  • حجم مجموعة البيانات : 181.88 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_ مل

  • حجم التحميل : 92.50 KiB

  • حجم مجموعة البيانات : 165.14 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 687

تتويبا / تتويبا_مر

  • حجم التحميل : 98.19 KiB

  • حجم مجموعة البيانات : 202.96 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_nl

  • حجم التحميل : 71.55 KiB

  • حجم مجموعة البيانات : 176.10 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_pt

  • حجم التحميل : 73.42 KiB

  • حجم مجموعة البيانات : 177.95 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_ru

  • حجم التحميل : 90.30 KiB

  • حجم مجموعة البيانات : 194.92 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_sw

  • حجم التحميل : 19.99 KiB

  • حجم مجموعة البيانات : 60.75 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 390

تتويبا / تتويبا_تا

  • حجم التحميل : 38.52 KiB

  • حجم مجموعة البيانات : 70.93 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 307

تتويبا / تتويبا

  • حجم التحميل : 24.55 KiB

  • حجم مجموعة البيانات : 49.07 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 234

تتويبا / تتويبا

  • حجم التحميل : 61.72 KiB

  • حجم مجموعة البيانات : 119.32 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 548

tatoeba / tatoeba_tl

  • حجم التحميل : 66.54 KiB

  • حجم مجموعة البيانات : 171.04 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

تتويبا / تتويبا_تر

  • حجم التحميل : 70.20 KiB

  • حجم مجموعة البيانات : 174.70 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_ur

  • حجم التحميل : 86.63 KiB

  • حجم مجموعة البيانات : 191.20 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_vi

  • حجم التحميل : 89.26 KiB

  • حجم مجموعة البيانات : 193.89 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000

tatoeba / tatoeba_zh

  • حجم التحميل : 67.32 KiB

  • حجم مجموعة البيانات : 171.85 KiB

  • الانقسامات :

ينقسم أمثلة
'train' 1،000