- Açıklama:
CREMA-D, duygu tanıma için bir görsel-işitsel veri setidir. Veri seti, bir dizi temel duygusal durumda (mutlu, üzgün, öfke, korku, iğrenme ve tarafsız) konuşulan cümlelerde yüz ve sesli duygusal ifadelerden oluşur. Farklı etnik kökenlere sahip 91 oyuncunun 7.442 klibi toplandı. Bu sürüm, yalnızca orijinal görsel-işitsel kayıttan gelen ses akışını içerir. Numuneler, her bir konuşmacıdan alınan numunelerin tam olarak bir bölmeye ait olması için eğitim, doğrulama ve test arasında bölünür.
Kaynak kodu:
tfds.audio.CremaD
sürümleri:
-
1.0.0
(varsayılan): Hayır sürüm notları.
-
İndirme boyutu:
579.25 MiB
Veri kümesi boyutu:
1.65 GiB
Otomatik önbelleğe ( dokümantasyon ): Hayır
Splits:
Bölmek | Örnekler |
---|---|
'test' | 1.556 |
'train' | 5144 |
'validation' | 738 |
- Özellikler:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
Denetimli tuşları (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): desteklenmez.
Örnekler ( tfds.as_dataframe ):
- Citation:
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}