- opis :
Sześćdziesiąt nagrań jednej osoby mówiącej tak lub nie po hebrajsku; każde nagranie ma osiem słów.
Głównym celem zestawu danych jest zapewnienie łatwego i szybkiego sposobu bezpłatnego testowania skryptów Kaldi.
Archiwum „waves_yesno.tar.gz” zawiera 60 plików .wav próbkowanych z częstotliwością 8 kHz. Wszystkie zostały nagrane przez tego samego mężczyznę mówiącego po hebrajsku. W każdym pliku osoba mówi 8 słów; każde słowo to po hebrajsku „tak” lub „nie”, więc każdy plik jest losową sekwencją 8 tak-tak lub nie. Nie ma osobnej transkrypcji; sekwencja jest zakodowana w nazwie pliku, gdzie 1 oznacza tak, a 0 oznacza nie.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.openslr.org/1/
Kod źródłowy :
tfds.audio.yesno.YesNo
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
4.49 MiB
Rozmiar zestawu danych :
16.27 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 60 |
- Struktura funkcji :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
audio | Audio | (Nic,) | int64 | |
dźwięk/nazwa pliku | Tekst | strunowy | ||
etykieta | Sekwencja (etykieta klasy) | (Nic,) | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised
):('audio', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}