có không

  • Mô tả :

Sáu mươi bản ghi âm của một cá nhân nói có hoặc không bằng tiếng Do Thái; mỗi đoạn ghi âm dài tám từ.

Điểm chính của tập dữ liệu là cung cấp một cách dễ dàng và nhanh chóng để kiểm tra miễn phí các tập lệnh Kaldi.

Kho lưu trữ "waves_yesno.tar.gz" chứa 60 tệp .wav, được lấy mẫu ở 8 kHz. Tất cả đều được ghi lại bởi cùng một diễn giả nam, bằng tiếng Do Thái. Trong mỗi tệp, cá nhân nói 8 từ; mỗi từ là tiếng Do Thái có nghĩa là "có" hoặc "không", vì vậy mỗi tệp là một chuỗi ngẫu nhiên gồm 8 từ có hoặc không. Không có phiên âm riêng được cung cấp; trình tự được mã hóa trong tên tệp, với 1 cho có và 0 cho không.

Tách ra ví dụ
'train' 60
  • Cấu trúc tính năng :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
âm thanh âm thanh (Không có,) int64
âm thanh/tên tệp Chữ sợi dây
nhãn mác Trình tự (Nhãn lớp) (Không có,) int64
  • trích dẫn :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}