- Mô tả:
Tập dữ liệu GoEmotions chứa 58k nhận xét Reddit được sắp xếp cẩn thận được gắn nhãn cho 27 danh mục cảm xúc hoặc Trung lập. Các danh mục cảm xúc là ngưỡng mộ, vui chơi, tức giận, khó chịu, chấp thuận, quan tâm, bối rối, tò mò, mong muốn, thất vọng, không đồng ý, ghê tởm, xấu hổ, phấn khích, sợ hãi, biết ơn, đau buồn, vui sướng, yêu, lo lắng, lạc quan, tự hào, nhận ra, nhẹ nhõm, hối hận, buồn bã, ngạc nhiên.
Trang chủ: https://github.com/google-research/google-research/tree/master/goemotions
Source code:
tfds.text.Goemotions
phiên bản:
-
0.1.0
(mặc định): Không có ghi chú phát hành.
-
Dung lượng tải về:
4.19 MiB
Dataset kích thước:
32.25 MiB
Tự động lưu trữ ( tài liệu ): Có
tách:
Tách ra | Các ví dụ |
---|---|
'test' | 5,427 |
'train' | 43.410 |
'validation' | 5,426 |
- Các tính năng:
FeaturesDict({
'admiration': tf.bool,
'amusement': tf.bool,
'anger': tf.bool,
'annoyance': tf.bool,
'approval': tf.bool,
'caring': tf.bool,
'comment_text': Text(shape=(), dtype=tf.string),
'confusion': tf.bool,
'curiosity': tf.bool,
'desire': tf.bool,
'disappointment': tf.bool,
'disapproval': tf.bool,
'disgust': tf.bool,
'embarrassment': tf.bool,
'excitement': tf.bool,
'fear': tf.bool,
'gratitude': tf.bool,
'grief': tf.bool,
'joy': tf.bool,
'love': tf.bool,
'nervousness': tf.bool,
'neutral': tf.bool,
'optimism': tf.bool,
'pride': tf.bool,
'realization': tf.bool,
'relief': tf.bool,
'remorse': tf.bool,
'sadness': tf.bool,
'surprise': tf.bool,
})
Phím giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- Trích dẫn:
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}