Referências:
as-bs
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/as-bs')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 8583 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"as",
"bs"
],
"id": null,
"_type": "Translation"
}
}
az-cs
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/az-cs')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 293 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"az",
"cs"
],
"id": null,
"_type": "Translation"
}
}
bg-de
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bg-de')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 184 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bg",
"de"
],
"id": null,
"_type": "Translation"
}
}
br-es_PR
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-es_PR')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 125 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"es_PR"
],
"id": null,
"_type": "Translation"
}
}
bn-ga
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bn-ga')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 7324 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bn",
"ga"
],
"id": null,
"_type": "Translation"
}
}
br-oi
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-hi')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 15551 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"hi"
],
"id": null,
"_type": "Translation"
}
}
br-la
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-la')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 527 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"la"
],
"id": null,
"_type": "Translation"
}
}
bs-szl
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bs-szl')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 646 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bs",
"szl"
],
"id": null,
"_type": "Translation"
}
}
br-uz
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-uz')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 1416 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"uz"
],
"id": null,
"_type": "Translation"
}
}
br-yi
Use o seguinte comando para carregar esse conjunto de dados no TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-yi')
- Descrição :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licença : Nenhuma licença conhecida
- Versão : 1.0.0
- Divisões :
Dividir | Exemplos |
---|---|
'train' | 2799 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"yi"
],
"id": null,
"_type": "Translation"
}
}