ted_hrlr_translate

  • Mô tả :

Các tập dữ liệu được lấy từ các bản ghi cuộc trò chuyện TED để so sánh các cặp ngôn ngữ tương tự, trong đó một là tài nguyên cao và tài nguyên kia là tài nguyên thấp.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate / az_to_en (cấu hình mặc định)

  • Mô tả cấu hình : Dịch tập dữ liệu từ az sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 903
'train' 5.946
'validation' 671
  • Cấu trúc tính năng :
Translation({
    'az': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
az Chữ tf.string
en Chữ tf.string

ted_hrlr_translate / aztr_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ az_tr sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 903
'train' 188.396
'validation' 671
  • Cấu trúc tính năng :
Translation({
    'az_tr': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
az_tr Chữ tf.string
en Chữ tf.string

ted_hrlr_translate / be_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ be sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 664
'train' 4.509
'validation' 248
  • Cấu trúc tính năng :
Translation({
    'be': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
thì là ở Chữ tf.string
en Chữ tf.string

ted_hrlr_translate / beru_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ be_ru sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 664
'train' 212.614
'validation' 248
  • Cấu trúc tính năng :
Translation({
    'be_ru': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
be_ru Chữ tf.string
en Chữ tf.string

ted_hrlr_translate / es_to_pt

  • Mô tả cấu hình : Dịch tập dữ liệu từ es sang pt ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.763
'train' 44,938
'validation' 1,016
  • Cấu trúc tính năng :
Translation({
    'es': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
es Chữ tf.string
pt Chữ tf.string

ted_hrlr_translate / fr_to_pt

  • Mô tả cấu hình : Dịch tập dữ liệu từ fr sang pt ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.494
'train' 43.873
'validation' 1.131
  • Cấu trúc tính năng :
Translation({
    'fr': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
fr Chữ tf.string
pt Chữ tf.string

ted_hrlr_translate / gl_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ gl sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.007
'train' 10.017
'validation' 682
  • Cấu trúc tính năng :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
en Chữ tf.string
gl Chữ tf.string

ted_hrlr_translate / glpt_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ gl_pt sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.007
'train' 61,802
'validation' 682
  • Cấu trúc tính năng :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'gl_pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
en Chữ tf.string
gl_pt Chữ tf.string

ted_hrlr_translate / he_to_pt

  • Mô tả cấu hình : Dịch tập dữ liệu từ anh ấy sang pt ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.623
'train' 48.511
'validation' 1.145
  • Cấu trúc tính năng :
Translation({
    'he': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
anh ta Chữ tf.string
pt Chữ tf.string

ted_hrlr_translate / it_to_pt

  • Mô tả cấu hình : Dịch tập dữ liệu từ nó sang pt ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.669
'train' 46.259
'validation' 1.162
  • Cấu trúc tính năng :
Translation({
    'it': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
Chữ tf.string
pt Chữ tf.string

ted_hrlr_translate / pt_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ pt sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.803
'train' 51.785
'validation' 1.193
  • Cấu trúc tính năng :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'pt': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
en Chữ tf.string
pt Chữ tf.string

ted_hrlr_translate / ru_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ ru sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 5.476
'train' 208.106
'validation' 4.805
  • Cấu trúc tính năng :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
en Chữ tf.string
ru Chữ tf.string

ted_hrlr_translate / ru_to_pt

  • Mô tả cấu hình : Dịch tập dữ liệu từ ru sang pt ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 1.588
'train' 47.278
'validation' 1.184
  • Cấu trúc tính năng :
Translation({
    'pt': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
pt Chữ tf.string
ru Chữ tf.string

ted_hrlr_translate / tr_to_en

  • Mô tả cấu hình : Dịch tập dữ liệu từ tr sang en ở dạng văn bản thuần túy.

  • Tách :

Tách ra Các ví dụ
'test' 5,029
'train' 182.450
'validation' 4.045
  • Cấu trúc tính năng :
Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Dịch
en Chữ tf.string
tr Chữ tf.string