млка

  • Описание :

MLQA (набор данных для ответов на многоязычные вопросы) — это эталонный набор данных для оценки эффективности ответов на многоязычные вопросы. Набор данных состоит из 7 языков: арабский, немецкий, испанский, английский, хинди, вьетнамский, китайский.

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
ответы Последовательность
ответы/answer_start Тензор tf.int32
ответы/текст Текст tf.string
контекст Текст tf.string
я бы Тензор tf.string
вопрос Текст tf.string
заглавие Текст tf.string
@article{lewis2019mlqa,
  title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
  author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel,   Sebastian and Schwenk, Holger},
  journal={arXiv preprint arXiv:1910.07475},
  year={2019}
}

mlqa/ar (конфигурация по умолчанию)

  • Описание конфигурации : MLQA 'ar' для разработчиков и тестов.

  • Размер набора данных : 9.27 MiB .

  • Сплиты :

Расколоть Примеры
'test' 5335
'validation' 517

млка/де

  • Описание конфигурации : MLQA 'de' dev и test разделены.

  • Размер набора данных : 5.06 MiB

  • Сплиты :

Расколоть Примеры
'test' 4517
'validation' 512

mlqa/en

  • Описание конфигурации : MLQA 'en' dev и test разделены.

  • Размер набора данных : 15.72 MiB .

  • Сплиты :

Расколоть Примеры
'test' 11 590
'validation' 1148

mlqa/es

  • Описание конфигурации : MLQA 'es' dev и test разделены.

  • Размер набора данных : 5.09 MiB .

  • Сплиты :

Расколоть Примеры
'test' 5253
'validation' 500

млка/привет

  • Описание конфигурации : MLQA 'hi' dev и test разделены.

  • Размер набора данных : 12.83 MiB .

  • Сплиты :

Расколоть Примеры
'test' 4918
'validation' 507

млка/ви

  • Описание конфигурации : MLQA 'vi' dev и test разделены.

  • Размер набора данных : 8.77 MiB .

  • Сплиты :

Расколоть Примеры
'test' 5495
'validation' 511

млкв/ч

  • Описание конфигурации : MLQA 'zh' dev и test разделены.

  • Размер набора данных : 5.13 MiB

  • Сплиты :

Расколоть Примеры
'test' 5137
'validation' 504