crema_d

  • 설명 :

CREMA-D는 감정 인식을 위한 시청각 데이터 세트입니다. 데이터 세트는 다양한 기본 감정 상태(기쁨, 슬픔, 분노, 두려움, 혐오 및 중립)에서 말하는 문장의 얼굴 및 음성 감정 표현으로 구성됩니다. 다양한 인종 배경을 가진 91명의 배우에 대한 7,442개의 클립이 수집되었습니다. 이 릴리스에는 원본 시청각 녹음의 오디오 스트림만 포함되어 있습니다. 샘플은 각 스피커의 샘플이 정확히 하나의 분할에 속하도록 훈련, 검증 및 테스트 간에 분할됩니다.

나뉘다
'test' 1,556
'train' 5,144
'validation' 738
  • 특징 :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=tf.int64),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
    'speaker_id': tf.string,
})
  • 인용 :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}