Tài liệu tham khảo:
bg-cs
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-cs')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 402657 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"cs"
],
"id": null,
"_type": "Translation"
}
}
bg-da
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-da')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 393449 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"da"
],
"id": null,
"_type": "Translation"
}
}
bg-de
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-de')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 393298 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"de"
],
"id": null,
"_type": "Translation"
}
}
bg-el
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-el')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 377341 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"el"
],
"id": null,
"_type": "Translation"
}
}
bg-en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-en')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 408290 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"en"
],
"id": null,
"_type": "Translation"
}
}
bg-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 388226 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"es"
],
"id": null,
"_type": "Translation"
}
}
bg-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 400712 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"et"
],
"id": null,
"_type": "Translation"
}
}
bg-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 396624 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"fi"
],
"id": null,
"_type": "Translation"
}
}
bg-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 393644 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"fr"
],
"id": null,
"_type": "Translation"
}
}
bg-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 382773 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"hu"
],
"id": null,
"_type": "Translation"
}
}
bg-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 377822 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"it"
],
"id": null,
"_type": "Translation"
}
}
bg-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 392554 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"lt"
],
"id": null,
"_type": "Translation"
}
}
bg-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 398355 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"lv"
],
"id": null,
"_type": "Translation"
}
}
bg-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 388273 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"nl"
],
"id": null,
"_type": "Translation"
}
}
bg-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 395269 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"pl"
],
"id": null,
"_type": "Translation"
}
}
bg-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 388972 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"pt"
],
"id": null,
"_type": "Translation"
}
}
bg-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 389381 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"ro"
],
"id": null,
"_type": "Translation"
}
}
bg-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 393815 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"sk"
],
"id": null,
"_type": "Translation"
}
}
bg-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 380231 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"sl"
],
"id": null,
"_type": "Translation"
}
}
bg-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/bg-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 398236 |
- Đặc trưng :
{
"translation": {
"languages": [
"bg",
"sv"
],
"id": null,
"_type": "Translation"
}
}
cs-da
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-da')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 618055 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"da"
],
"id": null,
"_type": "Translation"
}
}
cs-de
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-de')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 568589 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"de"
],
"id": null,
"_type": "Translation"
}
}
cs-el
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-el')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 599489 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"el"
],
"id": null,
"_type": "Translation"
}
}
cs-en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-en')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 647095 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"en"
],
"id": null,
"_type": "Translation"
}
}
cs-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 619774 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"es"
],
"id": null,
"_type": "Translation"
}
}
cs-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 636512 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"et"
],
"id": null,
"_type": "Translation"
}
}
cs-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 619320 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"fi"
],
"id": null,
"_type": "Translation"
}
}
cs-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 628200 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"fr"
],
"id": null,
"_type": "Translation"
}
}
cs-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 616160 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"hu"
],
"id": null,
"_type": "Translation"
}
}
cs-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 607017 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"it"
],
"id": null,
"_type": "Translation"
}
}
cs-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 624292 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"lt"
],
"id": null,
"_type": "Translation"
}
}
cs-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 627873 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"lv"
],
"id": null,
"_type": "Translation"
}
}
cs-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 618414 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"nl"
],
"id": null,
"_type": "Translation"
}
}
cs-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621387 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"pl"
],
"id": null,
"_type": "Translation"
}
}
cs-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 609729 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"pt"
],
"id": null,
"_type": "Translation"
}
}
cs-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 392085 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"ro"
],
"id": null,
"_type": "Translation"
}
}
cs-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 636128 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"sk"
],
"id": null,
"_type": "Translation"
}
}
cs-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 611624 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"sl"
],
"id": null,
"_type": "Translation"
}
}
cs-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/cs-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 631544 |
- Đặc trưng :
{
"translation": {
"languages": [
"cs",
"sv"
],
"id": null,
"_type": "Translation"
}
}
da-de
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-de')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1928414 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"de"
],
"id": null,
"_type": "Translation"
}
}
da-el
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-el')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1280579 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"el"
],
"id": null,
"_type": "Translation"
}
}
da-en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-en')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1991647 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"en"
],
"id": null,
"_type": "Translation"
}
}
da-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1943931 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"es"
],
"id": null,
"_type": "Translation"
}
}
da-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 635018 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"et"
],
"id": null,
"_type": "Translation"
}
}
da-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1917260 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"fi"
],
"id": null,
"_type": "Translation"
}
}
da-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1992590 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"fr"
],
"id": null,
"_type": "Translation"
}
}
đại hồ
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 617519 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"hu"
],
"id": null,
"_type": "Translation"
}
}
da-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1876703 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"it"
],
"id": null,
"_type": "Translation"
}
}
da-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 614923 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"lt"
],
"id": null,
"_type": "Translation"
}
}
da-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 627809 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"lv"
],
"id": null,
"_type": "Translation"
}
}
da-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1987498 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"nl"
],
"id": null,
"_type": "Translation"
}
}
da-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 642544 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"pl"
],
"id": null,
"_type": "Translation"
}
}
da-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1930454 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"pt"
],
"id": null,
"_type": "Translation"
}
}
da-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 388156 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"ro"
],
"id": null,
"_type": "Translation"
}
}
da-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621907 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"sk"
],
"id": null,
"_type": "Translation"
}
}
da-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 595944 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"sl"
],
"id": null,
"_type": "Translation"
}
}
da-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/da-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1871171 |
- Đặc trưng :
{
"translation": {
"languages": [
"da",
"sv"
],
"id": null,
"_type": "Translation"
}
}
de-el
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-el')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1223026 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"el"
],
"id": null,
"_type": "Translation"
}
}
de-en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-en')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1961119 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"en"
],
"id": null,
"_type": "Translation"
}
}
de-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1887879 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"es"
],
"id": null,
"_type": "Translation"
}
}
gỡ bỏ
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 578248 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"et"
],
"id": null,
"_type": "Translation"
}
}
de-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1871185 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"fi"
],
"id": null,
"_type": "Translation"
}
}
de-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1942666 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"fr"
],
"id": null,
"_type": "Translation"
}
}
de-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 563571 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"hu"
],
"id": null,
"_type": "Translation"
}
}
bỏ nó đi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1832989 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"it"
],
"id": null,
"_type": "Translation"
}
}
de-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 565892 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"lt"
],
"id": null,
"_type": "Translation"
}
}
de-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 573226 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"lv"
],
"id": null,
"_type": "Translation"
}
}
de-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1934111 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"nl"
],
"id": null,
"_type": "Translation"
}
}
de-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 579166 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"pl"
],
"id": null,
"_type": "Translation"
}
}
de-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1884176 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"pt"
],
"id": null,
"_type": "Translation"
}
}
de-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 385663 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"ro"
],
"id": null,
"_type": "Translation"
}
}
bàn làm việc
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 569381 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"sk"
],
"id": null,
"_type": "Translation"
}
}
de-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 546212 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"sl"
],
"id": null,
"_type": "Translation"
}
}
de-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/de-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1842026 |
- Đặc trưng :
{
"translation": {
"languages": [
"de",
"sv"
],
"id": null,
"_type": "Translation"
}
}
el-en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-en')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1292180 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"en"
],
"id": null,
"_type": "Translation"
}
}
el-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1272383 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"es"
],
"id": null,
"_type": "Translation"
}
}
el-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 599915 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"et"
],
"id": null,
"_type": "Translation"
}
}
el-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1227612 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"fi"
],
"id": null,
"_type": "Translation"
}
}
el-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1290796 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"fr"
],
"id": null,
"_type": "Translation"
}
}
el-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 586250 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"hu"
],
"id": null,
"_type": "Translation"
}
}
el-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1231222 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"it"
],
"id": null,
"_type": "Translation"
}
}
el-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 590850 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"lt"
],
"id": null,
"_type": "Translation"
}
}
el-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 596929 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"lv"
],
"id": null,
"_type": "Translation"
}
}
el-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1277297 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"nl"
],
"id": null,
"_type": "Translation"
}
}
el-xin vui lòng
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 591069 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"pl"
],
"id": null,
"_type": "Translation"
}
}
el-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1261188 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"pt"
],
"id": null,
"_type": "Translation"
}
}
el-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 372839 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"ro"
],
"id": null,
"_type": "Translation"
}
}
el-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 600684 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"sk"
],
"id": null,
"_type": "Translation"
}
}
el-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 579109 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"sl"
],
"id": null,
"_type": "Translation"
}
}
el-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/el-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1273743 |
- Đặc trưng :
{
"translation": {
"languages": [
"el",
"sv"
],
"id": null,
"_type": "Translation"
}
}
en-es
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-es')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2009073 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"es"
],
"id": null,
"_type": "Translation"
}
}
en-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 651236 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"et"
],
"id": null,
"_type": "Translation"
}
}
en-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1969624 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"fi"
],
"id": null,
"_type": "Translation"
}
}
en-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2051014 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"fr"
],
"id": null,
"_type": "Translation"
}
}
en-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 625178 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"hu"
],
"id": null,
"_type": "Translation"
}
}
en-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1946253 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"it"
],
"id": null,
"_type": "Translation"
}
}
en-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 634284 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"lt"
],
"id": null,
"_type": "Translation"
}
}
en-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 639318 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"lv"
],
"id": null,
"_type": "Translation"
}
}
en-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2027447 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"nl"
],
"id": null,
"_type": "Translation"
}
}
en-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 631160 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"pl"
],
"id": null,
"_type": "Translation"
}
}
en-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2002943 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"pt"
],
"id": null,
"_type": "Translation"
}
}
en-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 400356 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"ro"
],
"id": null,
"_type": "Translation"
}
}
en-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 639958 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sk"
],
"id": null,
"_type": "Translation"
}
}
en-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 624803 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sl"
],
"id": null,
"_type": "Translation"
}
}
en-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/en-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1892723 |
- Đặc trưng :
{
"translation": {
"languages": [
"en",
"sv"
],
"id": null,
"_type": "Translation"
}
}
es-et
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-et')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 618350 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"et"
],
"id": null,
"_type": "Translation"
}
}
es-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1901596 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"fi"
],
"id": null,
"_type": "Translation"
}
}
es-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1982990 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"fr"
],
"id": null,
"_type": "Translation"
}
}
es-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 604007 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"hu"
],
"id": null,
"_type": "Translation"
}
}
ừ-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1880982 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"it"
],
"id": null,
"_type": "Translation"
}
}
es-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 611082 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"lt"
],
"id": null,
"_type": "Translation"
}
}
es-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 615496 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"lv"
],
"id": null,
"_type": "Translation"
}
}
es-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1954351 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"nl"
],
"id": null,
"_type": "Translation"
}
}
es-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 609297 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"pl"
],
"id": null,
"_type": "Translation"
}
}
es-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1933321 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"pt"
],
"id": null,
"_type": "Translation"
}
}
es-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 387653 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"ro"
],
"id": null,
"_type": "Translation"
}
}
es-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 619027 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"sk"
],
"id": null,
"_type": "Translation"
}
}
es-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 599168 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"sl"
],
"id": null,
"_type": "Translation"
}
}
es-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/es-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1826855 |
- Đặc trưng :
{
"translation": {
"languages": [
"es",
"sv"
],
"id": null,
"_type": "Translation"
}
}
et-fi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-fi')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 620939 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"fi"
],
"id": null,
"_type": "Translation"
}
}
et-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 630126 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"fr"
],
"id": null,
"_type": "Translation"
}
}
et-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 628044 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"hu"
],
"id": null,
"_type": "Translation"
}
}
và nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 607088 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"it"
],
"id": null,
"_type": "Translation"
}
}
et-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 622003 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"lt"
],
"id": null,
"_type": "Translation"
}
}
et-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 637468 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"lv"
],
"id": null,
"_type": "Translation"
}
}
et-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621150 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"nl"
],
"id": null,
"_type": "Translation"
}
}
v.v.
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 639046 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"pl"
],
"id": null,
"_type": "Translation"
}
}
et-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 616238 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"pt"
],
"id": null,
"_type": "Translation"
}
}
et-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 389087 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"ro"
],
"id": null,
"_type": "Translation"
}
}
et-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 634168 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"sk"
],
"id": null,
"_type": "Translation"
}
}
et-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 609731 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"sl"
],
"id": null,
"_type": "Translation"
}
}
et-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/et-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 656646 |
- Đặc trưng :
{
"translation": {
"languages": [
"et",
"sv"
],
"id": null,
"_type": "Translation"
}
}
fi-fr
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-fr')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1964126 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"fr"
],
"id": null,
"_type": "Translation"
}
}
fi-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 606348 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"hu"
],
"id": null,
"_type": "Translation"
}
}
fi-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1845203 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"it"
],
"id": null,
"_type": "Translation"
}
}
fi-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 613113 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"lt"
],
"id": null,
"_type": "Translation"
}
}
fi-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 616816 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"lv"
],
"id": null,
"_type": "Translation"
}
}
v-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1940808 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"nl"
],
"id": null,
"_type": "Translation"
}
}
fi-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 612689 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"pl"
],
"id": null,
"_type": "Translation"
}
}
fi-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1885062 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"pt"
],
"id": null,
"_type": "Translation"
}
}
fi-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 391430 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"ro"
],
"id": null,
"_type": "Translation"
}
}
fi-sk
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 623686 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"sk"
],
"id": null,
"_type": "Translation"
}
}
fi-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 596661 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"sl"
],
"id": null,
"_type": "Translation"
}
}
fi-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fi-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1883314 |
- Đặc trưng :
{
"translation": {
"languages": [
"fi",
"sv"
],
"id": null,
"_type": "Translation"
}
}
fr-hu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-hu')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 615791 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"hu"
],
"id": null,
"_type": "Translation"
}
}
fr-nó
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1943673 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"it"
],
"id": null,
"_type": "Translation"
}
}
fr-lt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 620660 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"lt"
],
"id": null,
"_type": "Translation"
}
}
fr-lv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 626280 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"lv"
],
"id": null,
"_type": "Translation"
}
}
fr-nl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 2029551 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"nl"
],
"id": null,
"_type": "Translation"
}
}
fr-pl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Tập dữ liệu đi kèm với giấy phép giống như các nguồn ban đầu. Vui lòng kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/Europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621402 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"pl"
],
"id": null,
"_type": "Translation"
}
}
fr-pt
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1980132 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"pt"
],
"id": null,
"_type": "Translation"
}
}
fr-ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 387846 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"ro"
],
"id": null,
"_type": "Translation"
}
}
fr-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 631846 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"sk"
],
"id": null,
"_type": "Translation"
}
}
fr-sl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 606897 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"sl"
],
"id": null,
"_type": "Translation"
}
}
fr-sv
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/fr-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1880390 |
- Đặc trưng :
{
"translation": {
"languages": [
"fr",
"sv"
],
"id": null,
"_type": "Translation"
}
}
hu-it
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-it')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 589563 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"it"
],
"id": null,
"_type": "Translation"
}
}
Hu-lt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 610298 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"lt"
],
"id": null,
"_type": "Translation"
}
}
hu-lv
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621101 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"lv"
],
"id": null,
"_type": "Translation"
}
}
Hu-nl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 605806 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"nl"
],
"id": null,
"_type": "Translation"
}
}
hu-pl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621820 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"pl"
],
"id": null,
"_type": "Translation"
}
}
hu-pt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 599639 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"pt"
],
"id": null,
"_type": "Translation"
}
}
Hu-ro
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 377239 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"ro"
],
"id": null,
"_type": "Translation"
}
}
Hu-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 618247 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"sk"
],
"id": null,
"_type": "Translation"
}
}
Hu-sl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 601671 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"sl"
],
"id": null,
"_type": "Translation"
}
}
HU-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/hu-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 631872 |
- Đặc trưng :
{
"translation": {
"languages": [
"hu",
"sv"
],
"id": null,
"_type": "Translation"
}
}
nó-lt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-lt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 593003 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"lt"
],
"id": null,
"_type": "Translation"
}
}
nó-lv
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 599394 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"lv"
],
"id": null,
"_type": "Translation"
}
}
nó-nl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1919855 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"nl"
],
"id": null,
"_type": "Translation"
}
}
nó-pl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 594472 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"pl"
],
"id": null,
"_type": "Translation"
}
}
nó-pt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1877432 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"pt"
],
"id": null,
"_type": "Translation"
}
}
nó-ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 367904 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"ro"
],
"id": null,
"_type": "Translation"
}
}
nó-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 603467 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"sk"
],
"id": null,
"_type": "Translation"
}
}
nó-sl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 579968 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"sl"
],
"id": null,
"_type": "Translation"
}
}
nó-sv
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/it-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1766096 |
- Đặc trưng :
{
"translation": {
"languages": [
"it",
"sv"
],
"id": null,
"_type": "Translation"
}
}
LT-LV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-lv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 621857 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"lv"
],
"id": null,
"_type": "Translation"
}
}
LT-NL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 613308 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"nl"
],
"id": null,
"_type": "Translation"
}
}
LT-PL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 617296 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"pl"
],
"id": null,
"_type": "Translation"
}
}
LT-PT
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 603223 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"pt"
],
"id": null,
"_type": "Translation"
}
}
LT-RO
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 384679 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"ro"
],
"id": null,
"_type": "Translation"
}
}
LT-SK
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 622997 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"sk"
],
"id": null,
"_type": "Translation"
}
}
LT-SL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 602442 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"sl"
],
"id": null,
"_type": "Translation"
}
}
LT-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lt-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 628817 |
- Đặc trưng :
{
"translation": {
"languages": [
"lt",
"sv"
],
"id": null,
"_type": "Translation"
}
}
LV-NL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-nl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 618352 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"nl"
],
"id": null,
"_type": "Translation"
}
}
LV-PL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 638453 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"pl"
],
"id": null,
"_type": "Translation"
}
}
LV-PT
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 615580 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"pt"
],
"id": null,
"_type": "Translation"
}
}
LV-Ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 390857 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"ro"
],
"id": null,
"_type": "Translation"
}
}
lv-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 629803 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"sk"
],
"id": null,
"_type": "Translation"
}
}
LV-SL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 607381 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"sl"
],
"id": null,
"_type": "Translation"
}
}
LV-SV
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/lv-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 643600 |
- Đặc trưng :
{
"translation": {
"languages": [
"lv",
"sv"
],
"id": null,
"_type": "Translation"
}
}
NL-PL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-pl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 612797 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"pl"
],
"id": null,
"_type": "Translation"
}
}
nl-pt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1957189 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"pt"
],
"id": null,
"_type": "Translation"
}
}
NL-Ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 380736 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"ro"
],
"id": null,
"_type": "Translation"
}
}
NL-SK
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 622650 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"sk"
],
"id": null,
"_type": "Translation"
}
}
NL-SL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 600023 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"sl"
],
"id": null,
"_type": "Translation"
}
}
NL-SV
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/nl-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1870685 |
- Đặc trưng :
{
"translation": {
"languages": [
"nl",
"sv"
],
"id": null,
"_type": "Translation"
}
}
pl-pt
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pl-pt')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 608181 |
- Đặc trưng :
{
"translation": {
"languages": [
"pl",
"pt"
],
"id": null,
"_type": "Translation"
}
}
pl-ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pl-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 389341 |
- Đặc trưng :
{
"translation": {
"languages": [
"pl",
"ro"
],
"id": null,
"_type": "Translation"
}
}
pl-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pl-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 624330 |
- Đặc trưng :
{
"translation": {
"languages": [
"pl",
"sk"
],
"id": null,
"_type": "Translation"
}
}
pl-sl
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pl-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 600511 |
- Đặc trưng :
{
"translation": {
"languages": [
"pl",
"sl"
],
"id": null,
"_type": "Translation"
}
}
PL-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pl-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 657951 |
- Đặc trưng :
{
"translation": {
"languages": [
"pl",
"sv"
],
"id": null,
"_type": "Translation"
}
}
PT-Ro
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pt-ro')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 381404 |
- Đặc trưng :
{
"translation": {
"languages": [
"pt",
"ro"
],
"id": null,
"_type": "Translation"
}
}
PT-SK
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pt-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 611895 |
- Đặc trưng :
{
"translation": {
"languages": [
"pt",
"sk"
],
"id": null,
"_type": "Translation"
}
}
PT-SL
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pt-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 593455 |
- Đặc trưng :
{
"translation": {
"languages": [
"pt",
"sl"
],
"id": null,
"_type": "Translation"
}
}
PT-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/pt-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1823402 |
- Đặc trưng :
{
"translation": {
"languages": [
"pt",
"sv"
],
"id": null,
"_type": "Translation"
}
}
ro-sk
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/ro-sk')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 387839 |
- Đặc trưng :
{
"translation": {
"languages": [
"ro",
"sk"
],
"id": null,
"_type": "Translation"
}
}
ro-sl
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/ro-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 374859 |
- Đặc trưng :
{
"translation": {
"languages": [
"ro",
"sl"
],
"id": null,
"_type": "Translation"
}
}
Ro-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/ro-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 390133 |
- Đặc trưng :
{
"translation": {
"languages": [
"ro",
"sv"
],
"id": null,
"_type": "Translation"
}
}
SK-SL
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/sk-sl')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 609698 |
- Đặc trưng :
{
"translation": {
"languages": [
"sk",
"sl"
],
"id": null,
"_type": "Translation"
}
}
SK-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/sk-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 636353 |
- Đặc trưng :
{
"translation": {
"languages": [
"sk",
"sv"
],
"id": null,
"_type": "Translation"
}
}
SL-SV
Sử dụng lệnh sau để tải bộ dữ liệu này trong TFDS:
ds = tfds.load('huggingface:europarl_bilingual/sl-sv')
- Sự miêu tả :
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
Giấy phép : Bộ dữ liệu đi kèm với giấy phép giống như các nguồn gốc. Xin vui lòng, kiểm tra thông tin về nguồn được cung cấp trên http://opus.nlpl.eu/europarl-v8.php
Phiên bản : 8.0.0
Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 608740 |
- Đặc trưng :
{
"translation": {
"languages": [
"sl",
"sv"
],
"id": null,
"_type": "Translation"
}
}