- विवरण:
क्रेमा-डी भावनाओं की पहचान के लिए ऑडियो-विजुअल डेटा सेट है। डेटा सेट में बुनियादी भावनात्मक अवस्थाओं (खुश, उदास, क्रोध, भय, घृणा और तटस्थ) में बोली जाने वाली वाक्यों में चेहरे और मुखर भावनात्मक भाव होते हैं। विविध जातीय पृष्ठभूमि वाले 91 अभिनेताओं के 7,442 क्लिप एकत्र किए गए। इस रिलीज़ में मूल ऑडियो-विज़ुअल रिकॉर्डिंग से केवल ऑडियो स्ट्रीम है। नमूनों को ट्रेन, सत्यापन और परीक्षण के बीच विभाजित किया जाता है ताकि प्रत्येक स्पीकर के नमूने ठीक एक विभाजन के हों।
स्रोत कोड:
tfds.audio.CremaD
संस्करण:
-
1.0.0
(डिफ़ॉल्ट): नहीं रिलीज नोट्स।
-
डाउनलोड का आकार:
579.25 MiB
डेटासेट का आकार:
1.65 GiB
ऑटो-कैश ( प्रलेखन ): नहीं
विभाजन:
विभाजित करना | उदाहरण |
---|---|
'test' | 1,556 |
'train' | 5,144 |
'validation' | 738 |
- विशेषताएं:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=tf.int64),
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=6),
'speaker_id': tf.string,
})
पर्यवेक्षित कुंजियों (देखें
as_supervised
डॉक ):('audio', 'label')
चित्रा ( tfds.show_examples ): समर्थित नहीं।
उदाहरण ( tfds.as_dataframe ):
- प्रशस्ति पत्र:
@article{cao2014crema,
title={ {CREMA-D}: Crowd-sourced emotional multimodal actors dataset},
author={Cao, Houwei and Cooper, David G and Keutmann, Michael K and Gur, Ruben C and Nenkova, Ani and Verma, Ragini},
journal={IEEE transactions on affective computing},
volume={5},
number={4},
pages={377--390},
year={2014},
publisher={IEEE}
}