ความรู้สึก140

  • คำอธิบาย :

Sentiment140 ช่วยให้คุณค้นพบความรู้สึกที่มีต่อแบรนด์ ผลิตภัณฑ์ หรือหัวข้อบน Twitter

ข้อมูลเป็น CSV ที่ลบอีโมติคอนออก รูปแบบไฟล์ข้อมูลมี 6 ฟิลด์:

  1. ขั้วของทวีต (0 = ลบ, 2 = เป็นกลาง, 4 = เป็นบวก)
  2. รหัสทวีต (2087)
  3. วันที่ทวีต (วันเสาร์ที่ 16 พฤษภาคม 23:58:44 UTC 2009)
  4. แบบสอบถาม (lyx) ถ้าไม่มีการสืบค้น ค่านี้จะเป็น NO_QUERY
  5. ผู้ใช้ที่ทวีต (robotickilldozr)
  6. ข้อความของทวีต (Lyx เจ๋งมาก)

สำหรับข้อมูลเพิ่มเติม โปรดดูบทความ Twitter Sentiment Classification with Distant Supervision ที่ https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf

แยก ตัวอย่าง
'test' 498
'train' 1,600,000
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
วันที่ ข้อความ สตริง
ขั้ว เทนเซอร์ int32
สอบถาม ข้อความ สตริง
ข้อความ ข้อความ สตริง
ผู้ใช้ ข้อความ สตริง
  • การอ้างอิง :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}