gtzan

Açıklama :

Veri seti, her biri 30 saniye uzunluğunda 1000 ses parçasından oluşur. Her biri 100 parça ile temsil edilen 10 tür içerir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.

Türler:

blues
klasik
ülke
disko
hiphop
caz
metal
pop
reggae
kaynak
Ek Belgeler : Belgeleri Keşfedin
Anasayfa : http://marsyas.info/index.html
Kaynak kodu : tfds.audio.gtzan.GTZAN
sürümler :
- 1.0.0 (varsayılan): Sürüm notu yok.
İndirme boyutu : 1.14 GiB
Veri kümesi boyutu : 3.71 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :

Bölmek	örnekler
`'train'`	1.000

Özellik yapısı :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})

Özellik belgeleri :

Özellik	Sınıf	Şekil	Dtipi
	ÖzelliklerDict
ses	Ses	(Hiçbiri,)	int64
ses/dosya adı	Metin		sicim
etiket	SınıfEtiketi		int64

Denetlenen tuşlar (Bkz as_supervised doc ): ('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):

Alıntı :

@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}

gtzan Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

gtzan