có không

  • Mô tả:

Sáu mươi đoạn ghi âm của một cá nhân nói có hoặc không bằng tiếng Do Thái; mỗi đoạn ghi âm dài tám từ.

Điểm chính của tập dữ liệu là cung cấp một cách dễ dàng và nhanh chóng để kiểm tra các tập lệnh Kaldi miễn phí.

Kho lưu trữ "wave_yesno.tar.gz" chứa 60 tệp .wav, được lấy mẫu ở 8 kHz. Tất cả đều được ghi âm bởi cùng một nam diễn giả, bằng tiếng Do Thái. Trong mỗi tệp, cá nhân nói 8 từ; mỗi từ là tiếng Do Thái có nghĩa là "có" hoặc "không", vì vậy mỗi tệp là một chuỗi ngẫu nhiên gồm 8 yes hoặc noes. Không có phiên âm riêng biệt được cung cấp; trình tự được mã hóa trong tên tệp, với 1 là có và 0 là không.

Tách ra Các ví dụ
'train' 60
  • Các tính năng:
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'audio/filename': Text(shape=(), dtype=tf.string),
    'label': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=2)),
})
  • Trích dẫn:
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}