para_rastrear

  • Descripción :

Corpora Paralelo a Escala Web para las Lenguas Oficiales Europeas.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (configuración predeterminada)

  • Descripción de la configuración : conjunto de datos de traducción de inglés a bg.

  • Tamaño de la descarga : 98.94 MiB

  • Tamaño del conjunto de datos : 362.46 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,039,885
  • Estructura de características :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
bg Texto cuerda
es Texto cuerda

para_crawl/encs

  • Descripción de la configuración : conjunto de datos de traducción de inglés a cs.

  • Tamaño de la descarga : 187.31 MiB

  • Tamaño del conjunto de datos : 666.34 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,981,949
  • Estructura de características :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
cs Texto cuerda
es Texto cuerda

para_crawl/enda

  • Descripción de la configuración : conjunto de datos de traducción del inglés al da.

  • Tamaño de la descarga : 174.34 MiB

  • Tamaño del conjunto de datos : 619.77 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,414,895
  • Estructura de características :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
da Texto cuerda
es Texto cuerda

para_crawl/final

  • Descripción de la configuración : conjunto de datos de traducción del inglés al de.

  • Tamaño de descarga : 1.22 GiB

  • Tamaño del conjunto de datos : 4.04 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 16,264,448
  • Estructura de características :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
Delaware Texto cuerda
es Texto cuerda

para_crawl/enel

  • Descripción de configuración : conjunto de datos de traducción de inglés a el.

  • Tamaño de la descarga : 184.59 MiB

  • Tamaño del conjunto de datos : 698.75 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,985,233
  • Estructura de características :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
el Texto cuerda
es Texto cuerda

para_crawl/enes

  • Descripción de configuración : conjunto de datos de traducción de inglés a es.

  • Tamaño de descarga : 1.82 GiB

  • Tamaño del conjunto de datos : 6.23 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 21,987,267
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
es Texto cuerda

para_crawl/enet

  • Descripción de la configuración : conjunto de datos de traducción del inglés al et.

  • Tamaño de la descarga : 66.91 MiB

  • Tamaño del conjunto de datos : 209.16 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 853,422
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
et Texto cuerda

para_crawl/enfi

  • Descripción de la configuración : conjunto de datos de traducción del inglés al fi.

  • Tamaño de la descarga : 151.83 MiB

  • Tamaño del conjunto de datos : 543.85 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,156,069
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
fi Texto cuerda

para_crawl/enfr

  • Descripción de la configuración : conjunto de datos de traducción del inglés al fr.

  • Tamaño de descarga : 2.63 GiB

  • Tamaño del conjunto de datos : 9.04 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 31.374.161
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
es Texto cuerda

para_crawl/enga

  • Descripción de la configuración : conjunto de datos de traducción del inglés al ga.

  • Tamaño de la descarga : 28.03 MiB

  • Tamaño del conjunto de datos : 107.09 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 357,399
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
Georgia Texto cuerda

para_crawl/enhr

  • Descripción de la configuración : Conjunto de datos de traducción de inglés a hr.

  • Tamaño de la descarga : 80.97 MiB

  • Tamaño del conjunto de datos : 256.37 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,002,053
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
hora Texto cuerda

para_crawl/enhu

  • Descripción de la configuración : conjunto de datos de traducción del inglés al hu.

  • Tamaño de la descarga : 114.24 MiB

  • Tamaño del conjunto de datos : 421.40 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,901,342
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
hu Texto cuerda

para_crawl/enit

  • Descripción de la configuración : conjunto de datos de traducción del inglés al mismo.

  • Tamaño de descarga : 1017.30 MiB

  • Tamaño del conjunto de datos : 3.36 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 12,162,239
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
eso Texto cuerda

para_crawl/enlt

  • Descripción de configuración : conjunto de datos de traducción de inglés a lt.

  • Tamaño de la descarga : 63.28 MiB

  • Tamaño del conjunto de datos : 204.70 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 844,643
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
es Texto cuerda

para_crawl/enlv

  • Descripción de la configuración : conjunto de datos de traducción de inglés a lv.

  • Tamaño de la descarga : 45.17 MiB

  • Tamaño del conjunto de datos : 147.09 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 553,060
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
lv Texto cuerda

para_crawl/enmt

  • Descripción de la configuración : conjunto de datos de traducción de inglés a mt.

  • Tamaño de la descarga : 18.15 MiB

  • Tamaño del conjunto de datos : 54.36 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 195,502
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
monte Texto cuerda

para_crawl/ennl

  • Descripción de la configuración : conjunto de datos de traducción del inglés al nl.

  • Tamaño de la descarga : 400.63 MiB

  • Tamaño del conjunto de datos : 1.40 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 5,659,268
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
nl Texto cuerda

para_crawl/enpl

  • Descripción de la configuración : conjunto de datos de traducción del inglés al pl.

  • Tamaño de la descarga : 257.90 MiB

  • Tamaño del conjunto de datos : 885.63 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 3.503.276
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
pl Texto cuerda

para_crawl/enpt

  • Descripción de la configuración : conjunto de datos de traducción de inglés a pt.

  • Tamaño de la descarga : 608.62 MiB

  • Tamaño del conjunto de datos : 2.05 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 8,141,940
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
punto Texto cuerda

para_crawl/enro

  • Descripción de la configuración : conjunto de datos de traducción del inglés al ro.

  • Tamaño de la descarga : 153.24 MiB

  • Tamaño del conjunto de datos : 534.34 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,952,043
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
Ro Texto cuerda

para_crawl/ensk

  • Descripción de la configuración : conjunto de datos de traducción del inglés al sk.

  • Tamaño de la descarga : 96.61 MiB

  • Tamaño del conjunto de datos : 352.91 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,591,831
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
sk Texto cuerda

para_crawl/ensl

  • Descripción de la configuración : conjunto de datos de traducción del inglés al sl.

  • Tamaño de la descarga : 62.02 MiB

  • Tamaño del conjunto de datos : 187.66 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 660,161
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
SL Texto cuerda

para_crawl/ensv

  • Descripción de la configuración : conjunto de datos de traducción del inglés al sv.

  • Tamaño de la descarga : 262.76 MiB

  • Tamaño del conjunto de datos : 905.72 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 3.476.729
  • Estructura de características :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
Traducción
es Texto cuerda
sv Texto cuerda