opus100

مراجع:

af-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/af-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 275512
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "af",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

am-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/am-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 89027
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "am",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

an-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/an-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 6961
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "an",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

as-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/as-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 138479
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "as",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

az-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/az-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 262089
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "az",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

be-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/be-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 67312
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "be",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/bg-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "bg",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bn-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/bn-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "bn",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

br-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/br-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 153447
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "br",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bs-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/bs-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "bs",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ca-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ca-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ca",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/cs-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "cs",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cy-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/cy-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 289521
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "cy",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/da-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "da",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/de-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "de",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

dz-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/dz-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 624
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "dz",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/el-en')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "el",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-eo

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-eo')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 337106
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "eo"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-es

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-es')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-et

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-et')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-eu

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-eu')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "eu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fa

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-fa')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "fa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fi

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-fi')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-fr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fy

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-fy')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 54342
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "fy"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ga

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ga')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 289524
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ga"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-gd

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-gd')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 1606
'train' 16316
'validation' 1605
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "gd"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-gl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-gl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 515344
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "gl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-gu

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-gu')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 318306
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "gu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ha

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ha')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 97983
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ha"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-he

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-he')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "he"
        ],
        "id": null,
        "_type": "Translation"
    }
}

سلام

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-hi')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 534319
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "hi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-hr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-hr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "hr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-hu

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-hu')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-hy

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-hy')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 7059
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "hy"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-id

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-id')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "id"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ig

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ig')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 1843
'train' 18415
'validation' 1843
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ig"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-is

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-is')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "is"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-it

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-it')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ja

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ja')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ja"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ka

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ka')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 377306
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ka"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-kk

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-kk')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 79927
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "kk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-km

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-km')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 111483
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "km"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ko

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ko')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ko"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-kn

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-kn')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 918
'train' 14537
'validation' 917
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "kn"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ku

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ku')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 144844
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ku"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ky

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ky')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 27215
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ky"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-li

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-li')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 25535
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "li"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-lt

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-lt')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-lv

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-lv')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-mg

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-mg')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 590771
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "mg"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-mk

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-mk')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "mk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ml

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ml')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 822746
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ml"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-mn

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-mn')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 4294
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "mn"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-mr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-mr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 27007
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "mr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ms

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ms')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ms"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-mt

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-mt')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "mt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-my

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-my')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 24594
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "my"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nb

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-nb')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 142906
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "nb"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ne

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ne')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 406381
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ne"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-nl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nn

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-nn')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 486055
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "nn"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-no

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-no')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "no"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-oc

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-oc')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 35791
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "oc"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-or

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-or')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 1318
'train' 14273
'validation' 1317
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "or"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pa

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-pa')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 107296
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "pa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-pl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ps

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ps')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 79127
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ps"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pt

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-pt')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ro

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ro')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ru

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ru')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ru"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-rw

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-rw')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 173823
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "rw"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-se

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-se')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 35907
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "se"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 267211
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-si

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-si')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 979109
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "si"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sk

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sk')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sq

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sq')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sq"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sv

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-sv')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ta

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ta')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 227014
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ta"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-te

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-te')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 64352
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "te"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-tg

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-tg')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 193882
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "tg"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-th

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-th')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "th"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-tk

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-tk')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 1852
'train' 13110
'validation' 1852
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "tk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-tr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-tr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "tr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-tt

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-tt')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 100843
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "tt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ug

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ug')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 72170
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ug"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-UK

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-uk')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "uk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ur

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-ur')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 753913
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "ur"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-uz

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-uz')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 173157
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "uz"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-vi

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-vi')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "vi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-wa

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-wa')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 104496
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "wa"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-xh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-xh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 439671
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "xh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-yi

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-yi')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 15010
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "yi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-yo

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-yo')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 10375
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "yo"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 1000000
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-zu

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/en-zu')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 38616
'validation' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "en",
            "zu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-de

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-de')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-fr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-fr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-nl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-nl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-ru

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-ru')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "ru"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ar-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ar-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ar",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-fr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/de-fr')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "de",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-nl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/de-nl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "de",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-ru

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/de-ru')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "de",
            "ru"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/de-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "de",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-nl

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/fr-nl')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "fr",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-ru

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/fr-ru')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "fr",
            "ru"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/fr-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "fr",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nl-ru

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/nl-ru')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "nl",
            "ru"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nl-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/nl-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "nl",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ru-zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:opus100/ru-zh')
  • توضیحات :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
  • مجوز : مجوز شناخته شده ای وجود ندارد
  • نسخه : 0.0.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
  • ویژگی ها :
{
    "translation": {
        "languages": [
            "ru",
            "zh"
        ],
        "id": null,
        "_type": "Translation"
    }
}