jakość_wina

  • opis :

Utworzono dwa zestawy danych, używając próbek czerwonego i białego wina. Dane wejściowe obejmują obiektywne testy (np. wartości PH), a dane wyjściowe są oparte na danych sensorycznych (mediana z co najmniej 3 ocen dokonanych przez ekspertów winiarskich). Każdy ekspert ocenił jakość wina od 0 (bardzo zła) do 10 (bardzo doskonała). Do modelowania tych zestawów danych w ramach podejścia regresyjnego zastosowano kilka metod eksploracji danych. Najlepsze wyniki osiągnął model maszyny wektora nośnego. Obliczono kilka metryk: MAD, macierz zamieszania dla ustalonej tolerancji błędu (T) itp. Wykreślamy również względne znaczenie zmiennych wejściowych (mierzone za pomocą procedury analizy wrażliwości).

Te dwa zestawy danych dotyczą czerwonych i białych odmian portugalskiego wina „Vinho Verde”. Więcej informacji można znaleźć na stronie: http://www.vinhoverde.pt/en/ lub w odnośniku [Cortez i in., 2009]. Ze względu na kwestie związane z prywatnością i logistyką dostępne są tylko zmienne fizykochemiczne (dane wejściowe) i sensoryczne (dane wyjściowe) (np. brak jest danych o rodzajach winogron, marce wina, cenie sprzedaży wina itp.).

Liczba instancji: czerwone wino - 1599; białe wino - 4898

Zmienne wejściowe (na podstawie badań fizykochemicznych):

  1. ustalona kwasowość
  2. lotna kwasowość
  3. kwas cytrynowy
  4. cukier resztkowy
  5. chlorki
  6. wolny dwutlenek siarki
  7. całkowity dwutlenek siarki
  8. gęstość
  9. pH
  10. siarczany
  11. alkohol

Zmienna wyjściowa (na podstawie danych sensorycznych):

  1. jakość (ocena od 0 do 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
cechy FunkcjeDict
cechy/alkohol Napinacz pływak32
cechy/chlorki Napinacz pływak32
właściwości/kwas cytrynowy Napinacz pływak32
cechy/gęstość Napinacz pływak32
cechy/kwasowość stała Napinacz pływak32
cechy/wolny dwutlenek siarki Napinacz pływak32
cechy/pH Napinacz pływak32
właściwości/cukier resztkowy Napinacz pływak32
właściwości/siarczany Napinacz pływak64
cechy/całkowity dwutlenek siarki Napinacz pływak32
cechy/kwasowość lotna Napinacz pływak32
jakość Napinacz int32
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (domyślna konfiguracja)

  • Opis konfiguracji : Białe wino

  • Rozmiar pliku do pobrania : 258.23 KiB

  • Rozmiar zestawu danych : 1.87 MiB

  • Podziały :

Rozdzielać Przykłady
'train' 4898

wino_jakość/czerwone

  • Opis konfiguracji : Czerwone wino

  • Rozmiar pliku do pobrania : 82.23 KiB

  • Rozmiar zbioru danych : 626.17 KiB

  • Podziały :

Rozdzielać Przykłady
'train' 1599