- Descrizione :
MLQA (Multilingual Question Answering Dataset) è un set di dati di riferimento per la valutazione delle prestazioni di risposta alle domande multilingue. Il set di dati è composto da 7 lingue: arabo, tedesco, spagnolo, inglese, hindi, vietnamita, cinese.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://github.com/facebookresearch/MLQA
Codice sorgente :
tfds.datasets.mlqa.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
72.21 MiB
Auto-cache ( documentazione ): Sì
Struttura delle caratteristiche :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
risposte | Sequenza | |||
risposte/risposta_inizio | Tensore | int32 | ||
risposte/testo | Testo | corda | ||
contesto | Testo | corda | ||
id | Tensore | corda | ||
domanda | Testo | corda | ||
titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (configurazione predefinita)
Descrizione della configurazione : MLQA 'ar' dev e test split.
Dimensione del set di dati:
9.28 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.335 |
'validation' | 517 |
- Esempi ( tfds.as_dataframe ):
mlqa/de
Descrizione della configurazione : MLQA 'de' dev e test split.
Dimensione del set di dati:
5.06 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 4.517 |
'validation' | 512 |
- Esempi ( tfds.as_dataframe ):
mlqa/it
Descrizione della configurazione : MLQA 'en' dev e test split.
Dimensione del set di dati:
15.72 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 11.590 |
'validation' | 1.148 |
- Esempi ( tfds.as_dataframe ):
mlqa/es
Descrizione della configurazione : MLQA 'es' dev e test split.
Dimensione del set di dati:
5.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.253 |
'validation' | 500 |
- Esempi ( tfds.as_dataframe ):
mlqa/ciao
Descrizione della configurazione : MLQA 'hi' dev e test split.
Dimensione del set di dati:
12.83 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 4.918 |
'validation' | 507 |
- Esempi ( tfds.as_dataframe ):
mlqa/vi
Descrizione della configurazione : MLQA 'vi' dev e test split.
Dimensione del set di dati:
8.77 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.495 |
'validation' | 511 |
- Esempi ( tfds.as_dataframe ):
mlqa/zh
Descrizione della configurazione : MLQA 'zh' dev e test split.
Dimensione del set di dati:
5.13 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.137 |
'validation' | 504 |
- Esempi ( tfds.as_dataframe ):