gtzan_music_speech

Descrizione :

Il set di dati è stato raccolto ai fini della discriminazione musicale / vocale. Il set di dati è composto da 120 tracce, ciascuna lunga 30 secondi. Ogni classe (musica/parlato) ha 60 esempi. Le tracce sono tutte file audio 22050Hz Mono 16-bit in formato .wav.

Documentazione aggiuntiva : Esplora documenti con codice
Homepage : http://marsia.info/index.html
Codice sorgente : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
Versioni :
- 1.0.0 (impostazione predefinita): nessuna nota di rilascio.
Dimensione del download : 283.29 MiB
Dimensione del set di dati: 424.64 MiB
Cache automatica ( documentazione ): No
Divisioni :

Diviso	Esempi
`'train'`	128

Struttura delle caratteristiche :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
Audio	Audio	(Nessuno,)	int64
audio/nome file	Testo		corda
etichetta	ClassLabel		int64

Chiavi supervisionate (Vedi as_supervised doc ): ('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):

Citazione :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

gtzan_music_speech Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

gtzan_music_speech