- توضیحات :
Sentiment140 به شما امکان می دهد احساسات یک برند، محصول یا موضوع را در توییتر کشف کنید.
داده ها یک CSV با شکلک های حذف شده است. فرمت فایل داده دارای 6 فیلد است:
- قطبیت توییت (0 = منفی، 2 = خنثی، 4 = مثبت)
- شناسه توییت (2087)
- تاریخ توییت (شنبه 16 مه 23:58:44 UTC 2009)
- پرس و جو (لیکس). اگر درخواستی وجود نداشته باشد، این مقدار NO_QUERY است.
- کاربری که توییت کرده است (robotickilldozr)
- متن توییت (Lyx جالب است)
برای اطلاعات بیشتر، به مقاله طبقه بندی احساسات توییتر با نظارت از راه دور در https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf مراجعه کنید .
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://help.sentiment140.com/home
کد منبع :
tfds.datasets.sentiment140.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
77.59 MiB
حجم مجموعه داده :
305.13 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 498 |
'train' | 1,600,000 |
- ساختار ویژگی :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تاریخ | متن | رشته | ||
قطبیت | تانسور | int32 | ||
پرس و جو | متن | رشته | ||
متن | متن | رشته | ||
کاربر | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
نظارت شده مراجعه کنید):('text', 'polarity')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}