- Descrição :
Este conjunto de dados contém traduções automáticas dos dados de treinamento do PAWS em inglês. As traduções são fornecidas pelo benchmark XTREME e abrangem os seguintes idiomas:
- Francês
- Espanhol
- Alemão
- chinês
- japonês
- coreano
Para mais detalhes sobre o PAWS, consulte os artigos: PAWS: Paraphrase Adversaries from Word Scrambling em https://arxiv.org/abs/1904.01130 e PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification em https://arxiv. org/abs/1908.11828
Para obter detalhes relacionados ao XTREME, consulte: XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization em https://arxiv.org/abs/2003.11080
Página inicial : https://github.com/google-research/xtreme
Código -fonte:
tfds.text.xtreme_pawsx.XtremePawsx
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Cache automático ( documentação ): Sim
Estrutura de recursos :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
etiqueta | ClassLabel | int64 | ||
frase1 | Texto | corda | ||
frase2 | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (configuração padrão)
Descrição da configuração : Traduzido para de
Tamanho do download :
22.34 MiB
Tamanho do conjunto de dados :
14.19 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.340 |
- Exemplos ( tfds.as_dataframe ):
xtreme_pawsx/es
Descrição da configuração : Traduzido para es
Tamanho do download :
22.27 MiB
Tamanho do conjunto de dados :
14.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.244 |
- Exemplos ( tfds.as_dataframe ):
xtreme_pawsx/fr
Descrição da configuração : Traduzido para fr
Tamanho do download :
22.70 MiB
Tamanho do conjunto de dados :
14.53 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.208 |
- Exemplos ( tfds.as_dataframe ):
xtreme_pawsx/ja
Descrição da configuração : Traduzido para ja
Tamanho do download :
25.12 MiB
Tamanho do conjunto de dados :
16.98 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.086 |
- Exemplos ( tfds.as_dataframe ):
xtreme_pawsx/ko
Descrição da configuração : Traduzido para ko
Tamanho do download :
22.99 MiB
Tamanho do conjunto de dados :
14.86 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.298 |
- Exemplos ( tfds.as_dataframe ):
xtreme_pawsx/zh
Descrição da configuração : Traduzido para zh
Tamanho do download :
21.45 MiB
Tamanho do conjunto de dados :
13.21 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 49.149 |
- Exemplos ( tfds.as_dataframe ):