настроение140

  • Описание :

Sentiment140 позволяет узнать отношение к бренду, продукту или теме в Twitter.

Данные представляют собой CSV-файл с удаленными смайликами. Формат файла данных имеет 6 полей:

  1. полярность твита (0 = отрицательный, 2 = нейтральный, 4 = положительный)
  2. идентификатор твита (2087)
  3. дата твита (сб, 16 мая, 23:58:44 UTC 2009 г.)
  4. запрос (lyx). Если запроса нет, то это значение равно NO_QUERY.
  5. пользователь, который написал в Твиттере (robotickilldozr)
  6. текст твита (Ликс классная)

Для получения дополнительной информации см. статью «Классификация настроений в Твиттере с дистанционным наблюдением» по адресу https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf .

Расколоть Примеры
'test' 498
'train' 1 600 000
  • Структура функции :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
датировать Текст нить
полярность Тензор int32
запрос Текст нить
текст Текст нить
пользователь Текст нить
  • Цитата :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}