- Описание :
Были созданы два набора данных с использованием образцов красного и белого вина. Входные данные включают объективные тесты (например, значения рН), а выходные данные основаны на органолептических данных (медиана не менее 3 оценок, сделанных винными экспертами). Каждый эксперт оценил качество вина от 0 (очень плохое) до 10 (очень отличное). Для моделирования этих наборов данных в рамках регрессионного подхода было применено несколько методов интеллектуального анализа данных. Модель опорных векторов достигла наилучших результатов. Были рассчитаны несколько показателей: MAD, матрица путаницы для фиксированного допуска ошибок (T) и т. д. Кроме того, мы наносим на график относительную важность входных переменных (измеряемую с помощью процедуры анализа чувствительности).
Два набора данных относятся к красному и белому вариантам португальского вина «Vinho Verde». Для получения более подробной информации см.: http://www.vinhoverde.pt/en/ или ссылку [Cortez et al., 2009]. Из соображений конфиденциальности и логистики доступны только физико-химические (входные) и органолептические (выходные) переменные (например, нет данных о сортах винограда, марке вина, продажной цене вина и т. д.).
Количество экземпляров: красное вино - 1599; белое вино - 4898
Входные переменные (на основе физико-химических тестов):
- фиксированная кислотность
- летучая кислотность
- лимонная кислота
- остаточный сахар
- хлориды
- свободный диоксид серы
- общий диоксид серы
- плотность
- рН
- сульфаты
- алкоголь
Выходная переменная (на основе сенсорных данных):
- качество (оценка от 0 до 10)
Домашняя страница : https://archive.ics.uci.edu/ml/datasets/wine+quality
Исходный код :
tfds.structured.wine_quality.WineQuality
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Автоматическое кэширование ( документация ): Да
Структура функции :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
Особенности | ОсобенностиDict | |||
особенности/алкоголь | Тензор | поплавок32 | ||
особенности/хлориды | Тензор | поплавок32 | ||
особенности/лимонная кислота | Тензор | поплавок32 | ||
характеристики/плотность | Тензор | поплавок32 | ||
особенности/фиксированная кислотность | Тензор | поплавок32 | ||
особенности/свободный диоксид серы | Тензор | поплавок32 | ||
характеристики/pH | Тензор | поплавок32 | ||
особенности/остаточный сахар | Тензор | поплавок32 | ||
особенности/сульфаты | Тензор | поплавок64 | ||
характеристики/общий диоксид серы | Тензор | поплавок32 | ||
особенности/летучая кислотность | Тензор | поплавок32 | ||
качественный | Тензор | int32 |
Ключи под наблюдением (см . документ
as_supervised
):('features', 'quality')
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (конфигурация по умолчанию)
Описание конфигурации : Белое вино
Размер загрузки :
258.23 KiB
Размер набора данных :
1.87 MiB
.Сплиты :
Расколоть | Примеры |
---|---|
'train' | 4898 |
- Примеры ( tfds.as_dataframe ):
wine_quality/красное
Описание конфигурации : Красное вино
Размер загрузки :
82.23 KiB
Размер набора данных :
626.17 KiB
.Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1599 |
- Примеры ( tfds.as_dataframe ):