- Descriptif :
L'ensemble de données GoEmotions contient 58 000 commentaires Reddit soigneusement sélectionnés, étiquetés pour 27 catégories d'émotions ou neutres. Les catégories d'émotions sont l'admiration, l'amusement, la colère, l'agacement, l'approbation, l'attention, la confusion, la curiosité, le désir, la déception, la désapprobation, le dégoût, l'embarras, l'excitation, la peur, la gratitude, le chagrin, la joie, l'amour, la nervosité, l'optimisme, la fierté, la réalisation, soulagement, remords, tristesse, surprise.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/google-research/google-research/tree/master/goemotions
Code source :
tfds.text.Goemotions
Versions :
-
0.1.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
4.19 MiB
Taille du jeu de données :
32.25 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 5 427 |
'train' | 43 410 |
'validation' | 5 426 |
- Structure des fonctionnalités :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
admiration | Tenseur | bourdonner | ||
amusement | Tenseur | bourdonner | ||
colère | Tenseur | bourdonner | ||
contrariété | Tenseur | bourdonner | ||
approbation | Tenseur | bourdonner | ||
soins | Tenseur | bourdonner | ||
commentaire_texte | Texte | chaîne de caractères | ||
confusion | Tenseur | bourdonner | ||
curiosité | Tenseur | bourdonner | ||
désir | Tenseur | bourdonner | ||
déception | Tenseur | bourdonner | ||
désapprobation | Tenseur | bourdonner | ||
dégoûter | Tenseur | bourdonner | ||
embarras | Tenseur | bourdonner | ||
excitation | Tenseur | bourdonner | ||
craindre | Tenseur | bourdonner | ||
Reconnaissance | Tenseur | bourdonner | ||
douleur | Tenseur | bourdonner | ||
joie | Tenseur | bourdonner | ||
aimer | Tenseur | bourdonner | ||
nervosité | Tenseur | bourdonner | ||
neutre | Tenseur | bourdonner | ||
optimisme | Tenseur | bourdonner | ||
Orgueil | Tenseur | bourdonner | ||
la concrétisation | Tenseur | bourdonner | ||
le soulagement | Tenseur | bourdonner | ||
remords | Tenseur | bourdonner | ||
tristesse | Tenseur | bourdonner | ||
surprendre | Tenseur | bourdonner |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}