tak nie

opis :

Sześćdziesiąt nagrań jednej osoby mówiącej tak lub nie po hebrajsku; każde nagranie ma osiem słów.

Głównym celem zestawu danych jest zapewnienie łatwego i szybkiego sposobu bezpłatnego testowania skryptów Kaldi.

Archiwum „waves_yesno.tar.gz” zawiera 60 plików .wav próbkowanych z częstotliwością 8 kHz. Wszystkie zostały nagrane przez tego samego mężczyznę mówiącego po hebrajsku. W każdym pliku osoba mówi 8 słów; każde słowo to po hebrajsku „tak” lub „nie”, więc każdy plik jest losową sekwencją 8 tak-tak lub nie. Nie ma osobnej transkrypcji; sekwencja jest zakodowana w nazwie pliku, gdzie 1 oznacza tak, a 0 oznacza nie.

Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.openslr.org/1/
Kod źródłowy : tfds.audio.yesno.YesNo
Wersje :
- 1.0.0 (domyślnie): Brak informacji o wersji.
Rozmiar pliku do pobrania : 4.49 MiB
Rozmiar zestawu danych : 16.27 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'train'`	60

Struktura funkcji :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
audio	Audio	(Nic,)	int64
dźwięk/nazwa pliku	Tekst		strunowy
etykieta	Sekwencja (etykieta klasy)	(Nic,)	int64

Klucze nadzorowane (zobacz dokument as_supervised ): ('audio', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}