gtzan

opis :

Zbiór danych składa się z 1000 ścieżek dźwiękowych, każda o długości 30 sekund. Zawiera 10 gatunków, każdy reprezentowany przez 100 utworów. Wszystkie ścieżki to 16-bitowe pliki audio 22050 Hz Mono w formacie .wav.

Gatunki to:

blues
klasyczny
kraj
dyskoteka
hip hop
jazz
metal
Muzyka pop
reggae
głaz
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : http://marsyas.info/index.html
Kod źródłowy : tfds.audio.gtzan.GTZAN
Wersje :
- 1.0.0 (domyślnie): Brak informacji o wersji.
Rozmiar pliku do pobrania : 1.14 GiB
Rozmiar zestawu danych : 3.71 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :

Rozdzielać	Przykłady
`'train'`	1000

Struktura funkcji :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

Dokumentacja funkcji :

Funkcja	Klasa	Kształt	Typ D
	FunkcjeDict
audio	Audio	(Nic,)	int64
dźwięk/nazwa pliku	Tekst		strunowy
etykieta	Etykieta klasy		int64

Klucze nadzorowane (zobacz dokument as_supervised ): ('audio', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

gtzan