wmt18_translate

  • Mô tả:

Dịch tập dữ liệu dựa trên dữ liệu từ statmt.org.

Các phiên bản tồn tại trong các năm khác nhau bằng cách sử dụng kết hợp nhiều nguồn dữ liệu. Các cơ sở wmt_translate cho phép bạn tạo cấu hình của riêng bạn để chọn cặp dữ liệu / ngôn ngữ của bạn bằng cách tạo ra một phong tục tfds.translate.wmt.WmtConfig .

config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
  • Trang chủ: http://www.statmt.org/wmt18/translation-task.html

  • Source code: tfds.translate.Wmt18Translate

  • phiên bản:

    • 1.0.0 (mặc định): Không có ghi chú phát hành.
  • Dung lượng tải về: Unknown size

  • Kích thước tập dữ liệu: Unknown size

  • Hướng dẫn tải về Hướng dẫn sử dụng: Bộ dữ liệu này đòi hỏi bạn phải tải về dữ liệu nguồn bằng tay vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    Một số cấu hình wmt ở đây, yêu cầu tải xuống thủ công. Vui lòng xem wmt.py để xem đường dẫn chính xác (và tên tệp) phải được tải xuống.

  • Tự động lưu trữ ( tài liệu ): Unknown

  • tách:

Tách ra Các ví dụ
@InProceedings{bojar-EtAl:2018:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Federmann, Christian  and  Fishel, Mark
    and Graham, Yvette  and  Haddow, Barry  and  Huck, Matthias  and
    Koehn, Philipp  and  Monz, Christof},
  title     = {Findings of the 2018 Conference on Machine Translation (WMT18)},
  booktitle = {Proceedings of the Third Conference on Machine Translation,
    Volume 2: Shared Task Papers},
  month     = {October},
  year      = {2018},
  address   = {Belgium, Brussels},
  publisher = {Association for Computational Linguistics},
  pages     = {272--307},
  url       = {http://www.aclweb.org/anthology/W18-6401}
}

wmt18_translate / cs-en (cấu hình mặc định)

  • Config mô tả: WMT 2018 cs-en nhiệm vụ dịch tập dữ liệu.

  • Các tính năng:

Translation({
    'cs': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt18_translate / de-en

  • Config mô tả: WMT 2018 de-en nhiệm vụ dịch tập dữ liệu.

  • Các tính năng:

Translation({
    'de': Text(shape=(), dtype=tf.string),
    'en': Text(shape=(), dtype=tf.string),
})

wmt18_translate / et-en

  • Config mô tả: WMT 2018 et-en dịch vụ dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'et': Text(shape=(), dtype=tf.string),
})

wmt18_translate / fi-en

  • Config mô tả: WMT 2018 fi-en dịch vụ dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'fi': Text(shape=(), dtype=tf.string),
})

wmt18_translate / kk-en

  • Config mô tả: WMT 2018 kk-en dịch vụ dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'kk': Text(shape=(), dtype=tf.string),
})

wmt18_translate / ru-en

  • Config mô tả: WMT 2018 ru-en nhiệm vụ dịch tập dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'ru': Text(shape=(), dtype=tf.string),
})

wmt18_translate / tr-en

  • Config mô tả: WMT 2018 tr-en dịch vụ dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'tr': Text(shape=(), dtype=tf.string),
})

wmt18_translate / zh-en

  • Config mô tả: WMT 2018 zh-en dịch vụ dữ liệu.

  • Các tính năng:

Translation({
    'en': Text(shape=(), dtype=tf.string),
    'zh': Text(shape=(), dtype=tf.string),
})