có không

Mô tả :

Sáu mươi bản ghi âm của một cá nhân nói có hoặc không bằng tiếng Do Thái; mỗi đoạn ghi âm dài tám từ.

Điểm chính của tập dữ liệu là cung cấp một cách dễ dàng và nhanh chóng để kiểm tra miễn phí các tập lệnh Kaldi.

Kho lưu trữ "waves_yesno.tar.gz" chứa 60 tệp .wav, được lấy mẫu ở 8 kHz. Tất cả đều được ghi lại bởi cùng một diễn giả nam, bằng tiếng Do Thái. Trong mỗi tệp, cá nhân nói 8 từ; mỗi từ là tiếng Do Thái có nghĩa là "có" hoặc "không", vì vậy mỗi tệp là một chuỗi ngẫu nhiên gồm 8 từ có hoặc không. Không có phiên âm riêng được cung cấp; trình tự được mã hóa trong tên tệp, với 1 cho có và 0 cho không.

Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://www.openslr.org/1/
Mã nguồn : tfds.audio.yesno.YesNo
Phiên bản :
- 1.0.0 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 4.49 MiB
Kích thước tập dữ liệu : 16.27 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :

Tách ra	ví dụ
`'train'`	60

Cấu trúc tính năng :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
âm thanh	âm thanh	(Không có,)	int64
âm thanh/tên tệp	Chữ		sợi dây
nhãn mác	Trình tự (Nhãn lớp)	(Không có,)	int64

Các khóa được giám sát (Xem as_supervised doc ): ('audio', 'label')
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}