- Deskripsi :
Dua kumpulan data dibuat, menggunakan sampel anggur merah dan putih. Masukan meliputi tes objektif (misalnya nilai PH) dan keluaran didasarkan pada data sensorik (median dari minimal 3 evaluasi yang dibuat oleh ahli anggur). Setiap pakar menilai kualitas anggur antara 0 (sangat buruk) dan 10 (sangat baik). Beberapa metode penambangan data diterapkan untuk memodelkan kumpulan data ini dengan pendekatan regresi. Model mesin vektor pendukung mencapai hasil terbaik. Beberapa metrik dihitung: MAD, matriks kebingungan untuk toleransi kesalahan tetap (T), dll. Juga, kami memplot kepentingan relatif dari variabel input (sebagaimana diukur dengan prosedur analisis sensitivitas).
Kedua kumpulan data tersebut terkait dengan varian anggur merah dan putih Portugis "Vinho Verde". Untuk detail lebih lanjut, lihat: http://www.vinhoverde.pt/en/ atau referensi [Cortez et al., 2009]. Karena masalah privasi dan logistik, hanya variabel fisikokimia (input) dan sensorik (output) yang tersedia (misalnya tidak ada data tentang jenis anggur, merek wine, harga jual wine, dll.).
Jumlah Contoh: anggur merah - 1599; anggur putih - 4898
Variabel masukan (berdasarkan uji fisikokimia):
- keasaman tetap
- keasaman yang mudah menguap
- asam sitrat
- sisa gula
- klorida
- belerang dioksida bebas
- sulfur dioksida total
- kepadatan
- pH
- sulfat
- alkohol
Variabel keluaran (berdasarkan data sensorik):
- kualitas (skor antara 0 dan 10)
Beranda : https://archive.ics.uci.edu/ml/datasets/wine+quality
Kode sumber :
tfds.structured.wine_quality.WineQuality
Versi :
-
1.0.0
(default): Tidak ada catatan rilis.
-
Di-cache otomatis ( dokumentasi ): Ya
Struktur fitur :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
fitur | fiturDict | |||
fitur/alkohol | Tensor | float32 | ||
fitur / klorida | Tensor | float32 | ||
fitur / asam sitrat | Tensor | float32 | ||
fitur/kepadatan | Tensor | float32 | ||
fitur / keasaman tetap | Tensor | float32 | ||
fitur/bebas sulfur dioksida | Tensor | float32 | ||
fitur/pH | Tensor | float32 | ||
fitur/sisa gula | Tensor | float32 | ||
fitur/sulfat | Tensor | float64 | ||
fitur/total sulfur dioksida | Tensor | float32 | ||
fitur / keasaman yang mudah menguap | Tensor | float32 | ||
kualitas | Tensor | int32 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('features', 'quality')
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (konfigurasi default)
Deskripsi konfigurasi : Anggur Putih
Ukuran unduhan :
258.23 KiB
Ukuran dataset :
1.87 MiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 4.898 |
- Contoh ( tfds.as_dataframe ):
kualitas_anggur/merah
Deskripsi konfigurasi : Red Wine
Ukuran unduhan :
82.23 KiB
Ukuran dataset :
626.17 KiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 1.599 |
- Contoh ( tfds.as_dataframe ):