вино_качество

  • Описание :

Были созданы два набора данных с использованием образцов красного и белого вина. Входные данные включают объективные тесты (например, значения рН), а выходные данные основаны на органолептических данных (медиана не менее 3 оценок, сделанных винными экспертами). Каждый эксперт оценил качество вина от 0 (очень плохое) до 10 (очень отличное). Для моделирования этих наборов данных в рамках регрессионного подхода было применено несколько методов интеллектуального анализа данных. Модель опорных векторов достигла наилучших результатов. Были рассчитаны несколько показателей: MAD, матрица путаницы для фиксированного допуска ошибок (T) и т. д. Кроме того, мы наносим на график относительную важность входных переменных (измеряемую с помощью процедуры анализа чувствительности).

Два набора данных относятся к красному и белому вариантам португальского вина «Vinho Verde». Для получения более подробной информации см.: http://www.vinhoverde.pt/en/ или ссылку [Cortez et al., 2009]. Из соображений конфиденциальности и логистики доступны только физико-химические (входные) и органолептические (выходные) переменные (например, нет данных о сортах винограда, марке вина, продажной цене вина и т. д.).

Количество экземпляров: красное вино - 1599; белое вино - 4898

Входные переменные (на основе физико-химических тестов):

  1. фиксированная кислотность
  2. летучая кислотность
  3. лимонная кислота
  4. остаточный сахар
  5. хлориды
  6. свободный диоксид серы
  7. общий диоксид серы
  8. плотность
  9. рН
  10. сульфаты
  11. алкоголь

Выходная переменная (на основе сенсорных данных):

  1. качество (оценка от 0 до 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': tf.float32,
        'chlorides': tf.float32,
        'citric acid': tf.float32,
        'density': tf.float32,
        'fixed acidity': tf.float32,
        'free sulfur dioxide': tf.float32,
        'pH': tf.float32,
        'residual sugar': tf.float32,
        'sulphates': tf.float64,
        'total sulfur dioxide': tf.float32,
        'volatile acidity': tf.float32,
    }),
    'quality': tf.int32,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
Особенности ОсобенностиDict
особенности/алкоголь Тензор tf.float32
особенности/хлориды Тензор tf.float32
особенности/лимонная кислота Тензор tf.float32
характеристики/плотность Тензор tf.float32
особенности/фиксированная кислотность Тензор tf.float32
особенности/свободный диоксид серы Тензор tf.float32
характеристики/pH Тензор tf.float32
особенности/остаточный сахар Тензор tf.float32
особенности/сульфаты Тензор tf.float64
характеристики/общий диоксид серы Тензор tf.float32
особенности/летучая кислотность Тензор tf.float32
качественный Тензор tf.int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (конфигурация по умолчанию)

  • Описание конфигурации : Белое вино

  • Размер загрузки : 258.23 KiB

  • Размер набора данных : 1.87 MiB .

  • Сплиты :

Расколоть Примеры
'train' 4898

wine_quality/красное

  • Описание конфигурации : Красное вино

  • Размер загрузки : 82.23 KiB

  • Размер набора данных : 626.17 KiB .

  • Сплиты :

Расколоть Примеры
'train' 1599