voxceleb

  • Mô tả :

Một tập dữ liệu quy mô lớn để xác định người nói. Dữ liệu này được thu thập từ hơn 1.251 người nói, với tổng số hơn 150 nghìn mẫu. Bản phát hành này chứa phần âm thanh của tập dữ liệu voxceleb1.1.

  • Trang chủ : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • Mã nguồn : tfds.audio.Voxceleb

  • Các phiên bản :

    • 1.2.1 (mặc định): Thêm trường youtube_id
  • Kích thước tải xuống : 4.68 MiB

  • Kích thước tập dữ liệu: 107.98 GiB

  • Hướng dẫn tải xuống thủ công: Tập dữ liệu này yêu cầu bạn tải xuống dữ liệu nguồn theo cách thủ công vào download_config.manual_dir (mặc định là ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir phải chứa tệp vox_dev_wav.zip. Hướng dẫn tải xuống tệp này được tìm thấy trong http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Tập dữ liệu này yêu cầu đăng ký.

  • Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không

  • Tách :

Tách ra Các ví dụ
'test' 7.972
'train' 134.000
'validation' 6.670
  • Các tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}