- Mô tả :
Sáu mươi bản ghi âm của một cá nhân nói có hoặc không bằng tiếng Do Thái; mỗi đoạn ghi âm dài tám từ.
Điểm chính của tập dữ liệu là cung cấp một cách dễ dàng và nhanh chóng để kiểm tra miễn phí các tập lệnh Kaldi.
Kho lưu trữ "waves_yesno.tar.gz" chứa 60 tệp .wav, được lấy mẫu ở 8 kHz. Tất cả đều được ghi lại bởi cùng một diễn giả nam, bằng tiếng Do Thái. Trong mỗi tệp, cá nhân nói 8 từ; mỗi từ là tiếng Do Thái có nghĩa là "có" hoặc "không", vì vậy mỗi tệp là một chuỗi ngẫu nhiên gồm 8 từ có hoặc không. Không có phiên âm riêng được cung cấp; trình tự được mã hóa trong tên tệp, với 1 cho có và 0 cho không.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.openslr.org/1/
Mã nguồn :
tfds.audio.yesno.YesNo
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
4.49 MiB
Kích thước tập dữ liệu :
16.27 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 60 |
- Cấu trúc tính năng :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
âm thanh | âm thanh | (Không có,) | int64 | |
âm thanh/tên tệp | Chữ | sợi dây | ||
nhãn mác | Trình tự (Nhãn lớp) | (Không có,) | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}