- คำอธิบาย :
Sentiment140 ช่วยให้คุณค้นพบความรู้สึกที่มีต่อแบรนด์ ผลิตภัณฑ์ หรือหัวข้อบน Twitter
ข้อมูลเป็น CSV ที่ลบอีโมติคอนออก รูปแบบไฟล์ข้อมูลมี 6 ฟิลด์:
- ขั้วของทวีต (0 = ลบ, 2 = เป็นกลาง, 4 = เป็นบวก)
- รหัสทวีต (2087)
- วันที่ทวีต (วันเสาร์ที่ 16 พฤษภาคม 23:58:44 UTC 2009)
- แบบสอบถาม (lyx) ถ้าไม่มีการสืบค้น ค่านี้จะเป็น NO_QUERY
- ผู้ใช้ที่ทวีต (robotickilldozr)
- ข้อความของทวีต (Lyx เจ๋งมาก)
สำหรับข้อมูลเพิ่มเติม โปรดดูบทความ Twitter Sentiment Classification with Distant Supervision ที่ https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
โฮมเพจ : http://help.sentiment140.com/home
ซอร์สโค้ด :
tfds.datasets.sentiment140.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
77.59 MiB
ขนาดชุดข้อมูล :
305.13 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 498 |
'train' | 1,600,000 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
วันที่ | ข้อความ | สตริง | ||
ขั้ว | เทนเซอร์ | int32 | ||
สอบถาม | ข้อความ | สตริง | ||
ข้อความ | ข้อความ | สตริง | ||
ผู้ใช้ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('text', 'polarity')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}