gtzan

  • Descriptif :

L'ensemble de données se compose de 1000 pistes audio de 30 secondes chacune. Il contient 10 genres, chacun représenté par 100 pistes. Les pistes sont toutes des fichiers audio 22050 Hz Mono 16 bits au format .wav.

Les genres sont :

Diviser Exemples
'train' 1 000
  • Structure des fonctionnalités :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
l'audio l'audio (Aucun,) int64
audio/nom de fichier Texte chaîne de caractères
étiquette Étiquette de classe int64
  • Citation :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}