sentimen140

  • Deskripsi :

Sentimen140 memungkinkan Anda menemukan sentimen merek, produk, atau topik di Twitter.

Datanya adalah CSV dengan emotikon dihapus. Format file data memiliki 6 bidang:

  1. polaritas tweet (0 = negatif, 2 = netral, 4 = positif)
  2. id tweet (2087)
  3. tanggal tweet (Sabtu 16 Mei 23:58:44 UTC 2009)
  4. kueri (lyx). Jika tidak ada kueri, maka nilai ini adalah NO_QUERY.
  5. pengguna yang men-tweet (robotickilldozr)
  6. teks tweet (Lyx keren)

Untuk informasi selengkapnya, lihat makalah Klasifikasi Sentimen Twitter dengan Pengawasan Jauh di https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

Membelah Contoh
'test' 498
'train' 1.600.000
  • Struktur fitur :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
tanggal Teks rangkaian
polaritas Tensor int32
pertanyaan Teks rangkaian
teks Teks rangkaian
pengguna Teks rangkaian
  • Kutipan :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}