воксфорж

  • Описание :

VoxForge — это набор данных для классификации языков. Он состоит из аудиоклипов, отправленных пользователями на веб-сайт. В этом релизе собраны данные с 6 языков - английского, испанского, французского, немецкого, русского и итальянского. Поскольку веб-сайт постоянно обновляется, в целях воспроизводимости этот выпуск содержит только записи, представленные до 01.01.2020. Образцы разделены между обучением, проверкой и тестированием, так что образцы от каждого спикера принадлежат ровно одному сплиту.

  • Дополнительная документация : изучить документы с кодом

  • Домашняя страница : http://www.voxforge.org/

  • Исходный код : tfds.audio.Voxforge

  • Версии :

    • 1.0.0 (по умолчанию): нет примечаний к выпуску.
  • Размер загрузки : Unknown size

  • Размер набора данных : Unknown size

  • Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в download_config.manual_dir (по умолчанию ~/tensorflow_datasets/downloads/manual/ ):
    VoxForge требует ручной загрузки аудиоархивов. Полный список архивов можно найти по адресу https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt . Его можно скачать с помощью следующей команды: wget -i voxforge_urls.txt -x Обратите внимание, что загрузка а для локального создания набора данных требуется ~ 100 ГБ дискового пространства (но только ~ 60 ГБ будет использоваться постоянно).

  • Автокэширование ( документация ): неизвестно

  • Сплиты :

Расколоть Примеры
  • Структура функции :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
аудио Аудио (Никто,) int64
этикетка Метка класса int64
спикер_ид Тензор нить
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}