goemotions

  • Mô tả :

Bộ dữ liệu GoEmotions chứa 58 nghìn bình luận Reddit được tuyển chọn cẩn thận được gắn nhãn cho 27 loại cảm xúc hoặc Trung tính. Các loại cảm xúc là ngưỡng mộ, thích thú, tức giận, khó chịu, tán thành, quan tâm, bối rối, tò mò, ham muốn, thất vọng, không tán thành, ghê tởm, bối rối, phấn khích, sợ hãi, biết ơn, đau buồn, vui sướng, yêu, hồi hộp, lạc quan, tự hào, nhận ra, cứu trợ, hối hận, buồn bã, bất ngờ.

Tách ra ví dụ
'test' 5,427
'train' 43,410
'validation' 5,426
  • Cấu trúc tính năng :
FeaturesDict({
    'admiration': bool,
    'amusement': bool,
    'anger': bool,
    'annoyance': bool,
    'approval': bool,
    'caring': bool,
    'comment_text': Text(shape=(), dtype=string),
    'confusion': bool,
    'curiosity': bool,
    'desire': bool,
    'disappointment': bool,
    'disapproval': bool,
    'disgust': bool,
    'embarrassment': bool,
    'excitement': bool,
    'fear': bool,
    'gratitude': bool,
    'grief': bool,
    'joy': bool,
    'love': bool,
    'nervousness': bool,
    'neutral': bool,
    'optimism': bool,
    'pride': bool,
    'realization': bool,
    'relief': bool,
    'remorse': bool,
    'sadness': bool,
    'surprise': bool,
})
  • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
sự khâm phục tenxơ bool
vui chơi giải trí tenxơ bool
Sự phẫn nộ tenxơ bool
khó chịu tenxơ bool
phê duyệt tenxơ bool
quan tâm tenxơ bool
comment_text Chữ sợi dây
sự hoang mang tenxơ bool
sự tò mò tenxơ bool
khao khát tenxơ bool
thất vọng tenxơ bool
không tán thành tenxơ bool
ghê tởm tenxơ bool
sự lúng túng tenxơ bool
phấn khích tenxơ bool
nỗi sợ tenxơ bool
lòng biết ơn tenxơ bool
nỗi buồn tenxơ bool
vui sướng tenxơ bool
yêu và quý tenxơ bool
lo lắng tenxơ bool
Trung tính tenxơ bool
lạc quan tenxơ bool
lòng tự trọng tenxơ bool
hiện thực hóa tenxơ bool
sự cứu tế tenxơ bool
hối hận tenxơ bool
sự sầu nảo tenxơ bool
bất ngờ tenxơ bool
  • trích dẫn :
@inproceedings{demszky-2020-goemotions,
    title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
    author = "Demszky, Dorottya  and
      Movshovitz-Attias, Dana  and
      Ko, Jeongwoo  and
      Cowen, Alan  and
      Nemade, Gaurav  and
      Ravi, Sujith",
    booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
    month = jul,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.acl-main.372",
    pages = "4040--4054",
}