gtzan

 • opis :

Zbiór danych składa się z 1000 ścieżek dźwiękowych, każda o długości 30 sekund. Zawiera 10 gatunków, każdy reprezentowany przez 100 utworów. Wszystkie ścieżki to 16-bitowe pliki audio 22050 Hz Mono w formacie .wav.

Gatunki to:

Rozdzielać Przykłady
'train' 1000
 • Struktura funkcji :
FeaturesDict({
  'audio': Audio(shape=(None,), dtype=int64),
  'audio/filename': Text(shape=(), dtype=string),
  'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
 • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
audio Audio (Nic,) int64
dźwięk/nazwa pliku Tekst strunowy
etykieta Etykieta klasy int64
 • Cytat :
@misc{tzanetakis_essl_cook_2001,
author  = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title   = "Automatic Musical Genre Classification Of Audio Signals",
url    = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year   = "2001"
}