- Descrição :
O Sentiment140 permite que você descubra o sentimento de uma marca, produto ou tópico no Twitter.
Os dados são um CSV com emoticons removidos. O formato do arquivo de dados tem 6 campos:
- a polaridade do tweet (0 = negativo, 2 = neutro, 4 = positivo)
- o id do tweet (2087)
- a data do tweet (sábado, 16 de maio 23:58:44 UTC 2009)
- a consulta (lyx). Se não houver consulta, esse valor será NO_QUERY.
- o usuário que tuitou (robotickilldozr)
- o texto do tweet (Lyx é legal)
Para obter mais informações, consulte o artigo Twitter Sentiment Classification with Distant Supervision em https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
Documentação Adicional : Explore em Papers With Code
Página inicial : http://help.sentiment140.com/home
Código -fonte:
tfds.datasets.sentiment140.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
77.59 MiB
Tamanho do conjunto de dados :
305.13 MiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 498 |
'train' | 1.600.000 |
- Estrutura de recursos :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Funcionalidade | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
encontro | Texto | fragmento | ||
polaridade | tensor | int32 | ||
inquerir | Texto | fragmento | ||
texto | Texto | fragmento | ||
do utilizador | Texto | fragmento |
Chaves supervisionadas (Veja
as_supervised
doc ):('text', 'polarity')
Figura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}