- Açıklama :
Veri seti, müzik/konuşma ayrımı amacıyla toplanmıştır. Veri seti, her biri 30 saniye uzunluğunda olan 120 parçadan oluşmaktadır. Her sınıf (müzik/konuşma) 60 örneğe sahiptir. Parçaların tümü, .wav biçimindeki 22050Hz Mono 16 bit ses dosyalarıdır.
Ek Belgeler : Belgeleri Keşfedin
Anasayfa : http://marsyas.info/index.html
Kaynak kodu :
tfds.audio.gtzan_music_speech.GTZANMusicSpeechsürümler :
-
1.0.0(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
283.29 MiBVeri kümesi boyutu :
424.64 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler |
|---|---|
'train' | 128 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Özellik belgeleri :
| Özellik | Sınıf | Şekil | Dtipi | Tanım |
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| ses | Ses | (Hiçbiri,) | int64 | |
| ses/dosya adı | Metin | sicim | ||
| etiket | SınıfEtiketi | int64 |
Denetlenen tuşlar (Bkz
as_superviseddoc ):('audio', 'label')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@ONLINE {Music Speech,
author = "Tzanetakis, George",
title = "GTZAN Music/Speech Collection",
year = "1999",
url = "http://marsyas.info/index.html"
}