europarl_song ngữ

Tài liệu tham khảo:

bg-cs

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-cs')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 402657
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "cs"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-da

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-da')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 393449
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "da"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-de

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-de')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 393298
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-el

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-el')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 377341
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-en

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-en')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 408290
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 388226
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 400712
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 396624
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 393644
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 382773
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 377822
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 392554
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 398355
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 388273
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 395269
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 388972
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 389381
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 393815
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 380231
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/bg-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 398236
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "bg",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-da

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-da')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 618055
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "da"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-de

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-de')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 568589
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-el

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-el')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 599489
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-en

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-en')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 647095
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 619774
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 636512
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 619320
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 628200
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 616160
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 607017
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 624292
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 627873
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 618414
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621387
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 609729
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 392085
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 636128
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 611624
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/cs-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 631544
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "cs",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-de

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-de')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1928414
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-el

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-el')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1280579
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-en

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-en')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1991647
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1943931
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 635018
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1917260
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1992590
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

đại hồ

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 617519
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1876703
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 614923
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 627809
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1987498
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 642544
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1930454
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 388156
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621907
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 595944
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

da-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/da-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1871171
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "da",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-el

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-el')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1223026
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-en

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-en')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1961119
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1887879
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

gỡ bỏ

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 578248
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1871185
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1942666
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 563571
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bỏ nó đi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1832989
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 565892
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 573226
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1934111
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 579166
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1884176
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 385663
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bàn làm việc

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 569381
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 546212
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

de-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/de-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1842026
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "de",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-en

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-en')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1292180
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1272383
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 599915
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1227612
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1290796
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 586250
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1231222
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 590850
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 596929
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1277297
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-xin vui lòng

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 591069
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1261188
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 372839
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 600684
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 579109
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

el-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/el-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1273743
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "el",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-es

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-es')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 2009073
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 651236
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1969624
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 2051014
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 625178
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1946253
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 634284
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 639318
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 2027447
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 631160
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 2002943
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 400356
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 639958
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 624803
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/en-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1892723
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "en",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-et

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-et')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 618350
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1901596
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1982990
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 604007
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ừ-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1880982
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 611082
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 615496
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1954351
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 609297
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1933321
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 387653
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 619027
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 599168
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/es-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1826855
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "es",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-fi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-fi')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 620939
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 630126
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 628044
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

và nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 607088
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 622003
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 637468
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621150
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

v.v.

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 639046
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 616238
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 389087
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 634168
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 609731
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/et-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 656646
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "et",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-fr

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-fr')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1964126
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 606348
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1845203
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 613113
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 616816
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

v-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1940808
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 612689
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1885062
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 391430
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-sk

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 623686
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 596661
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fi-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1883314
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fi",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-hu

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-hu')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 615791
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-nó

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1943673
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-lt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 620660
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-lv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 626280
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-nl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 2029551
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-pl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621402
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-pt

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1980132
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 387846
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 631846
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-sl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 606897
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-sv

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/fr-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1880390
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "fr",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-it

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-it')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 589563
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Hu-lt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 610298
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-lv

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621101
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Hu-nl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 605806
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-pl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621820
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-pt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 599639
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Hu-ro

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 377239
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Hu-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 618247
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Hu-sl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 601671
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

HU-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/hu-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 631872
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "hu",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-lt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-lt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 593003
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-lv

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 599394
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-nl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1919855
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-pl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 594472
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-pt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1877432
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 367904
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 603467
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-sl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 579968
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nó-sv

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/it-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1766096
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "it",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-LV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-lv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 621857
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-NL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 613308
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-PL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 617296
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-PT

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 603223
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-RO

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 384679
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-SK

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 622997
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-SL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 602442
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lt-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 628817
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lt",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-NL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-nl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 618352
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-PL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 638453
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-PT

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 615580
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-Ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 390857
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 629803
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-SL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 607381
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-SV

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/lv-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 643600
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "lv",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-PL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-pl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 612797
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nl-pt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1957189
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-Ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 380736
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SK

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 622650
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 600023
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SV

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/nl-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1870685
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "nl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-pt

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pl-pt')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 608181
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pl",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pl-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 389341
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pl",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pl-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 624330
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pl",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-sl

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pl-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 600511
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pl",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PL-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pl-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 657951
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-Ro

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pt-ro')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 381404
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pt",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SK

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pt-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 611895
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pt",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SL

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pt-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 593455
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pt",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/pt-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 1823402
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "pt",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ro-sk

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/ro-sk')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 387839
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "ro",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ro-sl

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/ro-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 374859
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "ro",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

Ro-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/ro-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 390133
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "ro",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SK-SL

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/sk-sl')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 609698
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "sk",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SK-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/sk-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 636353
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "sk",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SL-SV

Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:

ds = tfds.load('huggingface:europarl_bilingual/sl-sv')
  • Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php

  • Phiên bản : 8.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 608740
  • Đặc trưng :
{
    "translation": {
        "languages": [
            "sl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}