crema_d

  • Descripción :

CREMA-D es un conjunto de datos audiovisuales para el reconocimiento de emociones. El conjunto de datos consta de expresiones emocionales faciales y vocales en oraciones pronunciadas en una variedad de estados emocionales básicos (feliz, triste, enfadado, miedo, asco y neutral). Se recogieron 7.442 clips de 91 actores de diversos orígenes étnicos. Esta versión contiene solo la secuencia de audio de la grabación audiovisual original. Las muestras se dividen entre entrenamiento, validación y prueba para que las muestras de cada hablante pertenezcan exactamente a una división.

Separar Ejemplos
'test' 1,556
'train' 5,144
'validation' 738
  • Estructura de características :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
audio Audio (Ninguna,) int64
etiqueta Etiqueta de clase int64
altavoz_id Tensor cuerda
  • Cita :
@article{cao2014crema,
  title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
  author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
  journal={IEEE transactions on affective computing},
  volume={5},
  number={4},
  pages={377--390},
  year={2014},
  publisher={IEEE}
}