- opis :
Utworzono dwa zestawy danych, używając próbek czerwonego i białego wina. Dane wejściowe obejmują obiektywne testy (np. wartości PH), a dane wyjściowe są oparte na danych sensorycznych (mediana z co najmniej 3 ocen dokonanych przez ekspertów winiarskich). Każdy ekspert ocenił jakość wina od 0 (bardzo zła) do 10 (bardzo doskonała). Do modelowania tych zestawów danych w ramach podejścia regresyjnego zastosowano kilka metod eksploracji danych. Najlepsze wyniki osiągnął model maszyny wektora nośnego. Obliczono kilka metryk: MAD, macierz zamieszania dla ustalonej tolerancji błędu (T) itp. Wykreślamy również względne znaczenie zmiennych wejściowych (mierzone za pomocą procedury analizy wrażliwości).
Te dwa zestawy danych dotyczą czerwonych i białych odmian portugalskiego wina „Vinho Verde”. Więcej informacji można znaleźć na stronie: http://www.vinhoverde.pt/en/ lub w odnośniku [Cortez i in., 2009]. Ze względu na kwestie związane z prywatnością i logistyką dostępne są tylko zmienne fizykochemiczne (dane wejściowe) i sensoryczne (dane wyjściowe) (np. brak jest danych o rodzajach winogron, marce wina, cenie sprzedaży wina itp.).
Liczba instancji: czerwone wino - 1599; białe wino - 4898
Zmienne wejściowe (na podstawie badań fizykochemicznych):
- ustalona kwasowość
- lotna kwasowość
- kwas cytrynowy
- cukier resztkowy
- chlorki
- wolny dwutlenek siarki
- całkowity dwutlenek siarki
- gęstość
- pH
- siarczany
- alkohol
Zmienna wyjściowa (na podstawie danych sensorycznych):
- jakość (ocena od 0 do 10)
Strona główna : https://archive.ics.uci.edu/ml/datasets/wine+quality
Kod źródłowy :
tfds.structured.wine_quality.WineQuality
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
cechy | FunkcjeDict | |||
cechy/alkohol | Napinacz | pływak32 | ||
cechy/chlorki | Napinacz | pływak32 | ||
właściwości/kwas cytrynowy | Napinacz | pływak32 | ||
cechy/gęstość | Napinacz | pływak32 | ||
cechy/kwasowość stała | Napinacz | pływak32 | ||
cechy/wolny dwutlenek siarki | Napinacz | pływak32 | ||
cechy/pH | Napinacz | pływak32 | ||
właściwości/cukier resztkowy | Napinacz | pływak32 | ||
właściwości/siarczany | Napinacz | pływak64 | ||
cechy/całkowity dwutlenek siarki | Napinacz | pływak32 | ||
cechy/kwasowość lotna | Napinacz | pływak32 | ||
jakość | Napinacz | int32 |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('features', 'quality')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (domyślna konfiguracja)
Opis konfiguracji : Białe wino
Rozmiar pliku do pobrania :
258.23 KiB
Rozmiar zestawu danych :
1.87 MiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 4898 |
- Przykłady ( tfds.as_dataframe ):
wino_jakość/czerwone
Opis konfiguracji : Czerwone wino
Rozmiar pliku do pobrania :
82.23 KiB
Rozmiar zbioru danych :
626.17 KiB
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1599 |
- Przykłady ( tfds.as_dataframe ):