tak nie

  • opis :

Sześćdziesiąt nagrań jednej osoby mówiącej tak lub nie po hebrajsku; każde nagranie ma osiem słów.

Głównym celem zestawu danych jest zapewnienie łatwego i szybkiego sposobu bezpłatnego testowania skryptów Kaldi.

Archiwum „waves_yesno.tar.gz” zawiera 60 plików .wav próbkowanych z częstotliwością 8 kHz. Wszystkie zostały nagrane przez tego samego mężczyznę mówiącego po hebrajsku. W każdym pliku osoba mówi 8 słów; każde słowo to po hebrajsku „tak” lub „nie”, więc każdy plik jest losową sekwencją 8 tak-tak lub nie. Nie ma osobnej transkrypcji; sekwencja jest zakodowana w nazwie pliku, gdzie 1 oznacza tak, a 0 oznacza nie.

Rozdzielać Przykłady
'train' 60
  • Struktura funkcji :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
audio Audio (Nic,) int64
dźwięk/nazwa pliku Tekst strunowy
etykieta Sekwencja (etykieta klasy) (Nic,) int64
  • Cytat :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}