- opis :
MLQA (Multilingual Question Answering Dataset) to zestaw danych porównawczych do oceny wydajności odpowiedzi na pytania wielojęzyczne. Zbiór danych składa się z 7 języków: arabski, niemiecki, hiszpański, angielski, hindi, wietnamski, chiński.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/facebookresearch/MLQA
Kod źródłowy :
tfds.datasets.mlqa.Builder
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
72.21 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
odpowiedzi | Sekwencja | |||
odpowiedzi/odpowiedź_start | Napinacz | int32 | ||
odpowiedzi/tekst | Tekst | strunowy | ||
kontekst | Tekst | strunowy | ||
ID | Napinacz | strunowy | ||
pytanie | Tekst | strunowy | ||
tytuł | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (domyślna konfiguracja)
Opis konfiguracji: podziały deweloperskie i testowe MLQA „ar”.
Rozmiar zestawu danych :
9.28 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 5335 |
'validation' | 517 |
- Przykłady ( tfds.as_dataframe ):
mlqa/de
Opis konfiguracji: Podział deweloperski i testowy MLQA „de”.
Rozmiar zestawu danych :
5.06 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 4517 |
'validation' | 512 |
- Przykłady ( tfds.as_dataframe ):
mlqa/en
Opis konfiguracji: Podział deweloperski i testowy MLQA „en”.
Rozmiar zestawu danych :
15.72 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 11590 |
'validation' | 1148 |
- Przykłady ( tfds.as_dataframe ):
mlqa/es
Opis konfiguracji: Podział deweloperski i testowy MLQA „es”.
Rozmiar zestawu danych :
5.09 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 5253 |
'validation' | 500 |
- Przykłady ( tfds.as_dataframe ):
mlqa/cześć
Opis konfiguracji: Podział deweloperski i testowy MLQA „cześć”.
Rozmiar zestawu danych :
12.83 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 4918 |
'validation' | 507 |
- Przykłady ( tfds.as_dataframe ):
mlqa/vi
Opis konfiguracji: Podział deweloperski i testowy MLQA „vi”.
Rozmiar zestawu danych :
8.77 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 5495 |
'validation' | 511 |
- Przykłady ( tfds.as_dataframe ):
mlqa/zh
Opis konfiguracji: Podział deweloperski i testowy MLQA „zh”.
Rozmiar zestawu danych :
5.13 MiB
Podziały :
Podział | Przykłady |
---|---|
'test' | 5137 |
'validation' | 504 |
- Przykłady ( tfds.as_dataframe ):