- توضیحات :
مجموعه دادههای مشتق شده از رونوشتهای گفتگوی TED برای مقایسه جفتهای زبانی مشابه که در آن یکی از منابع بالا و دیگری منابع کم است.
صفحه اصلی : https://github.com/neulab/word-embeddings-for-nmt
کد منبع :
tfds.datasets.ted_hrlr_translate.Builder
نسخه ها :
-
1.0.0
(پیشفرض): API تقسیم جدید ( https://tensorflow.org/datasets/splits )
-
حجم دانلود :
124.94 MiB
ذخیره خودکار ( اسناد ): بله
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (پیکربندی پیش فرض)
توضیحات پیکربندی : مجموعه داده های ترجمه از az به en در متن ساده.
حجم مجموعه داده :
1.61 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 903 |
'train' | 5,946 |
'validation' | 671 |
- ساختار ویژگی :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
az | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):('az', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از az_tr به en در متن ساده.
حجم مجموعه داده :
42.54 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 903 |
'train' | 188,396 |
'validation' | 671 |
- ساختار ویژگی :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
az_tr | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('az_tr', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از be به en در متن ساده.
حجم مجموعه داده :
1.47 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 664 |
'train' | 4509 |
'validation' | 248 |
- ساختار ویژگی :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
بودن | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('be', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از be_ru به en در متن ساده.
حجم مجموعه داده :
62.45 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 664 |
'train' | 212614 |
'validation' | 248 |
- ساختار ویژگی :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
be_ru | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('be_ru', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
توضیحات پیکربندی : مجموعه داده های ترجمه از es به pt در متن ساده.
حجم مجموعه داده :
9.62 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1763 |
'train' | 44938 |
'validation' | 1,016 |
- ساختار ویژگی :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
es | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('es', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
توضیحات پیکربندی : مجموعه داده های ترجمه از fr به pt در متن ساده.
حجم مجموعه داده :
9.74 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1,494 |
'train' | 43,873 |
'validation' | 1,131 |
- ساختار ویژگی :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
fr | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('fr', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از gl به en در متن ساده.
حجم مجموعه داده :
2.41 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1007 |
'train' | 10,017 |
'validation' | 682 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
gl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('gl', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از gl_pt به en در متن ساده.
حجم مجموعه داده :
12.90 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1007 |
'train' | 61,802 |
'validation' | 682 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
gl_pt | متن | رشته |
کلیدهای نظارت شده ( به عنوان_سند
as_supervised
مراجعه کنید):('gl_pt', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
توضیحات پیکربندی : مجموعه داده ترجمه از او به pt در متن ساده.
حجم مجموعه داده :
11.71 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1623 |
'train' | 48511 |
'validation' | 1,145 |
- ساختار ویژگی :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
او | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('he', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
توضیحات پیکربندی : مجموعه داده های ترجمه از آن به pt در متن ساده.
حجم مجموعه داده :
9.94 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1669 |
'train' | 46259 |
'validation' | 1,162 |
- ساختار ویژگی :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
آی تی | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('it', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از pt به en در متن ساده.
حجم مجموعه داده :
10.89 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1,803 |
'train' | 51,785 |
'validation' | 1193 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('pt', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از ru به en در متن ساده.
حجم مجموعه داده :
63.22 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 5,476 |
'train' | 208,106 |
'validation' | 4805 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
ru | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('ru', 'en')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
توضیحات پیکربندی : مجموعه داده های ترجمه از ru به pt در متن ساده.
حجم مجموعه داده :
13.00 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1,588 |
'train' | 47278 |
'validation' | 1184 |
- ساختار ویژگی :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
pt | متن | رشته | ||
ru | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('ru', 'pt')
مثالها ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
توضیحات پیکربندی : مجموعه داده های ترجمه از tr به en در متن ساده.
حجم مجموعه داده :
42.33 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 5,029 |
'train' | 182,450 |
'validation' | 4,045 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
tr | متن | رشته |
کلیدهای نظارت شده (نگاه کنید
as_supervised
doc ):('tr', 'en')
مثالها ( tfds.as_dataframe ):