- Deskripsi :
Sentimen140 memungkinkan Anda menemukan sentimen merek, produk, atau topik di Twitter.
Datanya adalah CSV dengan emotikon dihapus. Format file data memiliki 6 bidang:
- polaritas tweet (0 = negatif, 2 = netral, 4 = positif)
- id tweet (2087)
- tanggal tweet (Sabtu 16 Mei 23:58:44 UTC 2009)
- kueri (lyx). Jika tidak ada kueri, maka nilai ini adalah NO_QUERY.
- pengguna yang men-tweet (robotickilldozr)
- teks tweet (Lyx keren)
Untuk informasi selengkapnya, lihat makalah Klasifikasi Sentimen Twitter dengan Pengawasan Jauh di https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://help.sentiment140.com/home
Kode sumber :
tfds.datasets.sentiment140.Builder
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
77.59 MiB
Ukuran dataset :
305.13 MiB
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 498 |
'train' | 1.600.000 |
- Struktur fitur :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
tanggal | Teks | rangkaian | ||
polaritas | Tensor | int32 | ||
pertanyaan | Teks | rangkaian | ||
teks | Teks | rangkaian | ||
pengguna | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('text', 'polarity')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}