- Descrição :
Dois conjuntos de dados foram criados, usando amostras de vinho tinto e branco. As entradas incluem testes objetivos (por exemplo, valores de PH) e a saída é baseada em dados sensoriais (mediana de pelo menos 3 avaliações feitas por especialistas em vinhos). Cada especialista classificou a qualidade do vinho entre 0 (muito ruim) e 10 (muito excelente). Vários métodos de mineração de dados foram aplicados para modelar esses conjuntos de dados sob uma abordagem de regressão. O modelo de máquina de vetores de suporte obteve os melhores resultados. Várias métricas foram calculadas: MAD, matriz de confusão para uma tolerância de erro fixa (T), etc. Além disso, plotamos as importâncias relativas das variáveis de entrada (medidas por um procedimento de análise de sensibilidade).
Os dois conjuntos de dados estão relacionados com as variantes tinto e branco do vinho português "Vinho Verde". Para mais detalhes, consulte: http://www.vinhoverde.pt/en/ ou a referência [Cortez et al., 2009]. Por questões de privacidade e logística, apenas estão disponíveis variáveis físico-químicas (entradas) e sensoriais (saídas) (por exemplo, não há dados sobre tipos de uva, marca de vinho, preço de venda do vinho, etc.).
Número de instâncias: vinho tinto - 1599; vinho branco - 4898
Variáveis de entrada (com base em testes físico-químicos):
- acidez fixa
- acidez volátil
- Ácido Cítrico
- açúcar residual
- cloretos
- dióxido de enxofre livre
- dióxido de enxofre total
- densidade
- pH
- sulfatos
- álcool
Variável de saída (com base em dados sensoriais):
- qualidade (pontuação entre 0 e 10)
Página inicial : https://archive.ics.uci.edu/ml/datasets/wine+quality
Código -fonte:
tfds.structured.wine_quality.WineQuality
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Cache automático ( documentação ): Sim
Estrutura de recursos :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
recursos | RecursosDict | |||
características/álcool | tensor | float32 | ||
características/cloretos | tensor | float32 | ||
características/ácido cítrico | tensor | float32 | ||
características/densidade | tensor | float32 | ||
características/acidez fixa | tensor | float32 | ||
características/dióxido de enxofre livre | tensor | float32 | ||
características/pH | tensor | float32 | ||
características/açúcar residual | tensor | float32 | ||
características/sulfatos | tensor | float64 | ||
características/dióxido de enxofre total | tensor | float32 | ||
características/acidez volátil | tensor | float32 | ||
qualidade | tensor | int32 |
Chaves supervisionadas (consulte o documento
as_supervised
):('features', 'quality')
Figura ( tfds.show_examples ): Não suportado.
Citação :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (configuração padrão)
Descrição da configuração : Vinho Branco
Tamanho do download :
258.23 KiB
Tamanho do conjunto de dados :
1.87 MiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 4.898 |
- Exemplos ( tfds.as_dataframe ):
qualidade_vinho/tinto
Descrição da configuração : Vinho tinto
Tamanho do download :
82.23 KiB
Tamanho do conjunto de dados :
626.17 KiB
Divisões :
Dividir | Exemplos |
---|---|
'train' | 1.599 |
- Exemplos ( tfds.as_dataframe ):