настроение140

  • Описание:

Sentiment140 позволяет узнать настроение бренда, продукта или темы в Twitter.

Данные представляют собой CSV-файл с удаленными смайликами. Формат файла данных имеет 6 полей:

  1. полярность твита (0 = отрицательный, 2 = нейтральный, 4 = положительный)
  2. идентификатор твита (2087)
  3. дата твита (сб, 16 мая, 23:58:44 UTC, 2009 г.)
  4. запрос (Lyx). Если запроса нет, то это значение NO_QUERY.
  5. пользователь, который написал твит (robotickilldozr)
  6. текст твита (Lyx крутой)

Для получения более подробной информации, обратитесь к бумажному Twitter Sentiment классификации с отдаленным надзором в https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Расколоть Примеры
'test' 498
'train' 1,600,000
  • Особенности:
FeaturesDict({
    'date': Text(shape=(), dtype=tf.string),
    'polarity': tf.int32,
    'query': Text(shape=(), dtype=tf.string),
    'text': Text(shape=(), dtype=tf.string),
    'user': Text(shape=(), dtype=tf.string),
})
  • Образец цитирования:
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}