goemotions

  • Mô tả:

Tập dữ liệu GoEmotions chứa 58k nhận xét Reddit được sắp xếp cẩn thận được gắn nhãn cho 27 danh mục cảm xúc hoặc Trung lập. Các danh mục cảm xúc là ngưỡng mộ, vui chơi, tức giận, khó chịu, chấp thuận, quan tâm, bối rối, tò mò, mong muốn, thất vọng, không đồng ý, ghê tởm, xấu hổ, phấn khích, sợ hãi, biết ơn, đau buồn, vui sướng, yêu, lo lắng, lạc quan, tự hào, nhận ra, nhẹ nhõm, hối hận, buồn bã, ngạc nhiên.

Tách ra Các ví dụ
'test' 5,427
'train' 43.410
'validation' 5,426
  • Các tính năng:
FeaturesDict({
    'admiration': tf.bool,
    'amusement': tf.bool,
    'anger': tf.bool,
    'annoyance': tf.bool,
    'approval': tf.bool,
    'caring': tf.bool,
    'comment_text': Text(shape=(), dtype=tf.string),
    'confusion': tf.bool,
    'curiosity': tf.bool,
    'desire': tf.bool,
    'disappointment': tf.bool,
    'disapproval': tf.bool,
    'disgust': tf.bool,
    'embarrassment': tf.bool,
    'excitement': tf.bool,
    'fear': tf.bool,
    'gratitude': tf.bool,
    'grief': tf.bool,
    'joy': tf.bool,
    'love': tf.bool,
    'nervousness': tf.bool,
    'neutral': tf.bool,
    'optimism': tf.bool,
    'pride': tf.bool,
    'realization': tf.bool,
    'relief': tf.bool,
    'remorse': tf.bool,
    'sadness': tf.bool,
    'surprise': tf.bool,
})
  • Trích dẫn:
@inproceedings{demszky-2020-goemotions,
    title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
    author = "Demszky, Dorottya  and
      Movshovitz-Attias, Dana  and
      Ko, Jeongwoo  and
      Cowen, Alan  and
      Nemade, Gaurav  and
      Ravi, Sujith",
    booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
    month = jul,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.acl-main.372",
    pages = "4040--4054",
}