- Descrição :
Corpora Paralelos em Escala Web para Línguas Oficiais Europeias.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://paracrawl.eu/releases.html
Código -fonte:
tfds.datasets.para_crawl.Builder
Versões :
-
1.2.0
(padrão): sem notas de versão.
-
Figura ( tfds.show_examples ): Não compatível.
Citação :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (configuração padrão)
Descrição da configuração : conjunto de dados de tradução do inglês para bg.
Tamanho do download :
98.94 MiB
Tamanho do conjunto de dados :
362.46 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.039.885 |
- Estrutura de recursos :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
bg | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'bg')
Exemplos ( tfds.as_dataframe ):
para_crawl/encs
Descrição da configuração : conjunto de dados de tradução de inglês para cs.
Tamanho do download :
187.31 MiB
Tamanho do conjunto de dados :
666.34 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.981.949 |
- Estrutura de recursos :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
cs | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'cs')
Exemplos ( tfds.as_dataframe ):
para_crawl/enda
Descrição da configuração : conjunto de dados de tradução de inglês para da.
Tamanho do download :
174.34 MiB
Tamanho do conjunto de dados :
619.77 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.414.895 |
- Estrutura de recursos :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
da | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'da')
Exemplos ( tfds.as_dataframe ):
para_crawl/fim
Descrição da configuração : conjunto de dados de tradução de inglês para de.
Tamanho do download :
1.22 GiB
Tamanho do conjunto de dados :
4.04 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 16.264.448 |
- Estrutura de recursos :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
de | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'de')
Exemplos ( tfds.as_dataframe ):
para_crawl/enel
Descrição da configuração : conjunto de dados de tradução do inglês para el.
Tamanho do download :
184.59 MiB
Tamanho do conjunto de dados :
698.75 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.985.233 |
- Estrutura de recursos :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
ele | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (consulte
as_supervised
doc ):('en', 'el')
Exemplos ( tfds.as_dataframe ):
para_crawl/enes
Descrição da configuração : conjunto de dados de tradução do inglês para o inglês.
Tamanho do download :
1.82 GiB
Tamanho do conjunto de dados :
6.23 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 21.987.267 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
es | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('en', 'es')
Exemplos ( tfds.as_dataframe ):
para_crawl/enet
Descrição da configuração : conjunto de dados de tradução do inglês para et.
Tamanho do download :
66.91 MiB
Tamanho do conjunto de dados :
209.16 MiB
Armazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 853.422 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
et | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'et')
Exemplos ( tfds.as_dataframe ):
para_crawl/enfi
Descrição da configuração : Conjunto de dados de tradução de inglês para fi.
Tamanho do download :
151.83 MiB
Tamanho do conjunto de dados :
543.85 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 2.156.069 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
fi | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'fi')
Exemplos ( tfds.as_dataframe ):
para_crawl/enfr
Descrição da configuração : conjunto de dados de tradução do inglês para fr.
Tamanho do download :
2.63 GiB
Tamanho do conjunto de dados :
9.04 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 31.374.161 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
fr | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'fr')
Exemplos ( tfds.as_dataframe ):
para_crawl/enga
Descrição da configuração : conjunto de dados de tradução de inglês para ga.
Tamanho do download :
28.03 MiB
Tamanho do conjunto de dados :
107.09 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'train' | 357.399 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
ga | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'ga')
Exemplos ( tfds.as_dataframe ):
para_crawl/enhr
Descrição da configuração : Conjunto de dados de tradução de inglês para hr.
Tamanho do download :
80.97 MiB
Tamanho do conjunto de dados :
256.37 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.002.053 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
hora | Texto | corda |
Chaves supervisionadas (Veja
as_supervised
doc ):('en', 'hr')
Exemplos ( tfds.as_dataframe ):
para_crawl/enhu
Descrição da configuração : conjunto de dados de tradução de inglês para hu.
Tamanho do download :
114.24 MiB
Tamanho do conjunto de dados :
421.40 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.901.342 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
ei | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'hu')
Exemplos ( tfds.as_dataframe ):
para_crawl/enit
Descrição da configuração : conjunto de dados de tradução do inglês para ele.
Tamanho do download :
1017.30 MiB
Tamanho do conjunto de dados :
3.36 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 12.162.239 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
isto | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'it')
Exemplos ( tfds.as_dataframe ):
para_crawl/enlt
Descrição da configuração : conjunto de dados de tradução de inglês para lt.
Tamanho do download :
63.28 MiB
Tamanho do conjunto de dados :
204.70 MiB
Armazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 844.643 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
lt | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'lt')
Exemplos ( tfds.as_dataframe ):
para_crawl/enlv
Descrição da configuração : conjunto de dados de tradução de inglês para lv.
Tamanho do download :
45.17 MiB
Tamanho do conjunto de dados :
147.09 MiB
Armazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 553.060 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
lv | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'lv')
Exemplos ( tfds.as_dataframe ):
para_crawl/enmt
Descrição da configuração : conjunto de dados de tradução de inglês para mt.
Tamanho do download :
18.15 MiB
Tamanho do conjunto de dados :
54.36 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'train' | 195.502 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
mt | Texto | corda |
Chaves supervisionadas (Veja
as_supervised
doc ):('en', 'mt')
Exemplos ( tfds.as_dataframe ):
para_crawl/ennl
Descrição da configuração : conjunto de dados de tradução de inglês para nl.
Tamanho do download :
400.63 MiB
Tamanho do conjunto de dados :
1.40 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 5.659.268 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
nl | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'nl')
Exemplos ( tfds.as_dataframe ):
para_crawl/enpl
Descrição da configuração : Conjunto de dados de tradução do inglês para o pl.
Tamanho do download :
257.90 MiB
Tamanho do conjunto de dados :
885.63 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 3.503.276 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
por favor | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'pl')
Exemplos ( tfds.as_dataframe ):
para_crawl/enpt
Descrição da configuração : conjunto de dados de tradução de inglês para pt.
Tamanho do download :
608.62 MiB
Tamanho do conjunto de dados :
2.05 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 8.141.940 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
pt | Texto | corda |
Chaves supervisionadas (Veja
as_supervised
doc ):('en', 'pt')
Exemplos ( tfds.as_dataframe ):
para_crawl/enro
Descrição da configuração : conjunto de dados de tradução de inglês para ro.
Tamanho do download :
153.24 MiB
Tamanho do conjunto de dados :
534.34 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.952.043 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
ro | Texto | corda |
Chaves supervisionadas (Veja
as_supervised
doc ):('en', 'ro')
Exemplos ( tfds.as_dataframe ):
para_crawl/ensk
Descrição da configuração : conjunto de dados de tradução de inglês para sk.
Tamanho do download :
96.61 MiB
Tamanho do conjunto de dados :
352.91 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.591.831 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
sk | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('en', 'sk')
Exemplos ( tfds.as_dataframe ):
para_crawl/ensl
Descrição da configuração : conjunto de dados de tradução do inglês para o sl.
Tamanho do download :
62.02 MiB
Tamanho do conjunto de dados :
187.66 MiB
Armazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False
(train)Divisões :
Dividir | Exemplos |
---|---|
'train' | 660.161 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
sl | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised
):('en', 'sl')
Exemplos ( tfds.as_dataframe ):
para_crawl/ensv
Descrição da configuração : Conjunto de dados de tradução de inglês para SV.
Tamanho do download :
262.76 MiB
Tamanho do conjunto de dados :
905.72 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'train' | 3.476.729 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
Tradução | ||||
pt | Texto | corda | ||
sv | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):('en', 'sv')
Exemplos ( tfds.as_dataframe ):