סנטימנט140

  • תיאור :

Sentiment140 מאפשר לך לגלות את הסנטימנט של מותג, מוצר או נושא בטוויטר.

הנתונים הם CSV עם אייקונים שהוסרו. פורמט קובץ הנתונים כולל 6 שדות:

  1. הקוטביות של הציוץ (0 = שלילי, 2 = ניטרלי, 4 = חיובי)
  2. המזהה של הציוץ (2087)
  3. תאריך הציוץ (שבת 16 במאי 23:58:44 UTC 2009)
  4. השאילתה (lyx). אם אין שאילתה, אז הערך הזה הוא NO_QUERY.
  5. המשתמש שצייץ (robotickilldozr)
  6. הטקסט של הציוץ (Lyx מגניב)

למידע נוסף, עיין בעיתון טוויטר סנטימנט סיווג עם פיקוח מרחוק בכתובת https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

לְפַצֵל דוגמאות
'test' 498
'train' 1,600,000
  • מבנה תכונה :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
תַאֲרִיך טֶקסט חוּט
קוטביות מוֹתֵחַ int32
שאילתא טֶקסט חוּט
טֶקסט טֶקסט חוּט
מִשׁתַמֵשׁ טֶקסט חוּט
  • ציטוט :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}