goemotions

  • Deskripsi :

Kumpulan data GoEmotions berisi 58k komentar Reddit yang dikurasi dengan cermat dan diberi label untuk 27 kategori emosi atau Netral. Kategori emosi adalah kekaguman, hiburan, kemarahan, gangguan, persetujuan, perhatian, kebingungan, rasa ingin tahu, keinginan, kekecewaan, ketidaksetujuan, jijik, malu, kegembiraan, ketakutan, terima kasih, kesedihan, kegembiraan, cinta, kegugupan, optimisme, kebanggaan, realisasi, lega, penyesalan, kesedihan, kejutan.

Membelah Contoh
'test' 5.427
'train' 43.410
'validation' 5.426
  • Struktur fitur :
FeaturesDict({
    'admiration': bool,
    'amusement': bool,
    'anger': bool,
    'annoyance': bool,
    'approval': bool,
    'caring': bool,
    'comment_text': Text(shape=(), dtype=string),
    'confusion': bool,
    'curiosity': bool,
    'desire': bool,
    'disappointment': bool,
    'disapproval': bool,
    'disgust': bool,
    'embarrassment': bool,
    'excitement': bool,
    'fear': bool,
    'gratitude': bool,
    'grief': bool,
    'joy': bool,
    'love': bool,
    'nervousness': bool,
    'neutral': bool,
    'optimism': bool,
    'pride': bool,
    'realization': bool,
    'relief': bool,
    'remorse': bool,
    'sadness': bool,
    'surprise': bool,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
kekaguman Tensor bool
hiburan Tensor bool
amarah Tensor bool
gangguan Tensor bool
persetujuan Tensor bool
peduli Tensor bool
komentar_teks Teks rangkaian
kebingungan Tensor bool
rasa ingin tahu Tensor bool
menginginkan Tensor bool
kekecewaan Tensor bool
ketidaksetujuan Tensor bool
menjijikkan Tensor bool
rasa malu Tensor bool
kegembiraan Tensor bool
takut Tensor bool
rasa syukur Tensor bool
duka Tensor bool
sukacita Tensor bool
cinta Tensor bool
kegugupan Tensor bool
netral Tensor bool
optimisme Tensor bool
kebanggaan Tensor bool
realisasi Tensor bool
lega Tensor bool
penyesalan Tensor bool
kesedihan Tensor bool
kejutan Tensor bool
  • Kutipan :
@inproceedings{demszky-2020-goemotions,
    title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
    author = "Demszky, Dorottya  and
      Movshovitz-Attias, Dana  and
      Ko, Jeongwoo  and
      Cowen, Alan  and
      Nemade, Gaurav  and
      Ravi, Sujith",
    booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
    month = jul,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.acl-main.372",
    pages = "4040--4054",
}