tình cảm140

  • Mô tả:

Sentiment140 cho phép bạn khám phá cảm xúc của một thương hiệu, sản phẩm hoặc chủ đề trên Twitter.

Dữ liệu là CSV có biểu tượng cảm xúc đã bị xóa. Định dạng tệp dữ liệu có 6 trường:

  1. cực của tweet (0 = tiêu cực, 2 = trung tính, 4 = dương)
  2. id của tweet (2087)
  3. ngày đăng tweet (23:58:44 UTC, ngày 16 tháng 5 năm 2009)
  4. truy vấn (lyx). Nếu không có truy vấn, thì giá trị này là NO_QUERY.
  5. người dùng đã tweet (robotickilldozr)
  6. nội dung của tweet (Lyx thật tuyệt)

Để biết thêm thông tin, tham khảo các giấy Twitter Phân Niềm tin với Giám sát Distant tại https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Tách ra Các ví dụ
'test' 498
'train' 1.600.000
  • Các tính năng:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • Trích dẫn:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}