- opis :
Sześćdziesiąt nagrań jednej osoby mówiącej tak lub nie po hebrajsku; każde nagranie ma osiem słów.
Głównym celem zestawu danych jest zapewnienie łatwego i szybkiego sposobu bezpłatnego testowania skryptów Kaldi.
Archiwum „waves_yesno.tar.gz” zawiera 60 plików .wav próbkowanych z częstotliwością 8 kHz. Wszystkie zostały nagrane przez tego samego mężczyznę mówiącego po hebrajsku. W każdym pliku osoba mówi 8 słów; każde słowo to po hebrajsku „tak” lub „nie”, więc każdy plik jest losową sekwencją 8 tak-tak lub nie. Nie ma osobnej transkrypcji; sekwencja jest zakodowana w nazwie pliku, gdzie 1 oznacza tak, a 0 oznacza nie.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.openslr.org/1/
Kod źródłowy :
tfds.audio.yesno.YesNoWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
4.49 MiBRozmiar zestawu danych :
16.27 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Rozdzielać | Przykłady |
|---|---|
'train' | 60 |
- Struktura funkcji :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| audio | Audio | (Nic,) | int64 | |
| dźwięk/nazwa pliku | Tekst | strunowy | ||
| etykieta | Sekwencja (etykieta klasy) | (Nic,) | int64 |
Klucze nadzorowane (zobacz dokument
as_supervised):('audio', 'label')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}