- คำอธิบาย :
สร้างชุดข้อมูลสองชุดโดยใช้ตัวอย่างไวน์แดงและไวน์ขาว ข้อมูลนำเข้ารวมถึงการทดสอบตามวัตถุประสงค์ (เช่น ค่าพีเอช) และผลลัพธ์ที่ได้ขึ้นอยู่กับข้อมูลทางประสาทสัมผัส (ค่ามัธยฐานของการประเมินอย่างน้อย 3 ครั้งที่ทำโดยผู้เชี่ยวชาญด้านไวน์) ผู้เชี่ยวชาญแต่ละคนให้คะแนนคุณภาพไวน์ระหว่าง 0 (แย่มาก) ถึง 10 (ยอดเยี่ยมมาก) วิธีการขุดข้อมูลหลายวิธีถูกนำมาใช้เพื่อสร้างแบบจำลองชุดข้อมูลเหล่านี้ภายใต้แนวทางการถดถอย โมเดลเครื่องเวกเตอร์สนับสนุนได้รับผลลัพธ์ที่ดีที่สุด มีการคำนวณเมตริกหลายอย่าง: MAD, เมทริกซ์ความสับสนสำหรับค่าเผื่อข้อผิดพลาดคงที่ (T) เป็นต้น นอกจากนี้ เรายังวางแผนความสำคัญสัมพัทธ์ของตัวแปรอินพุต (ตามที่วัดโดยขั้นตอนการวิเคราะห์ความไว)
ชุดข้อมูลทั้งสองเกี่ยวข้องกับสีแดงและสีขาวของไวน์โปรตุเกส "Vinho Verde" สำหรับรายละเอียดเพิ่มเติม โปรดปรึกษา: http://www.vinhoverde.pt/en/ หรือข้อมูลอ้างอิง [Cortez et al., 2009] เนื่องจากปัญหาความเป็นส่วนตัวและลอจิสติกส์ จึงมีเฉพาะตัวแปรทางเคมีกายภาพ (อินพุต) และประสาทสัมผัส (เอาต์พุต) เท่านั้น (เช่น ไม่มีข้อมูลเกี่ยวกับชนิดองุ่น ยี่ห้อไวน์ ราคาขายไวน์ ฯลฯ)
จำนวนอินสแตนซ์: ไวน์แดง - 1599; ไวน์ขาว - 4898
ตัวแปรอินพุต (ตามการทดสอบทางเคมีกายภาพ):
- ความเป็นกรดคงที่
- ความเป็นกรดระเหยได้
- กรดมะนาว
- น้ำตาลที่เหลือ
- คลอไรด์
- ฟรีซัลเฟอร์ไดออกไซด์
- ซัลเฟอร์ไดออกไซด์ทั้งหมด
- ความหนาแน่น
- ค่าความเป็นกรดด่าง
- ซัลเฟต
- แอลกอฮอล์
ตัวแปรเอาต์พุต (ขึ้นอยู่กับข้อมูลทางประสาทสัมผัส):
- คุณภาพ (คะแนนระหว่าง 0 ถึง 10)
หน้าแรก : https://archive.ics.uci.edu/ml/datasets/wine+quality
รหัสที่มา :
tfds.structured.wine_quality.WineQuality
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
แคชอัตโนมัติ ( เอกสาร ): ใช่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คุณสมบัติ | คุณสมบัติDict | |||
คุณสมบัติ/แอลกอฮอล์ | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/คลอไรด์ | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/กรดซิตริก | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/ความหนาแน่น | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/ความเป็นกรดคงที่ | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/ปราศจากซัลเฟอร์ไดออกไซด์ | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/ความเป็นกรดด่าง | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/กากน้ำตาล | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ / ซัลเฟต | เทนเซอร์ | float64 | ||
คุณสมบัติ/ซัลเฟอร์ไดออกไซด์ทั้งหมด | เทนเซอร์ | ลอย32 | ||
คุณสมบัติ/ความเป็นกรดระเหยได้ | เทนเซอร์ | ลอย32 | ||
คุณภาพ | เทนเซอร์ | int32 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('features', 'quality')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : ไวน์ขาว
ขนาดการดาวน์โหลด :
258.23 KiB
ขนาดชุดข้อมูล :
1.87 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 4,898 |
- ตัวอย่าง ( tfds.as_dataframe ):
ไวน์_คุณภาพ/แดง
คำอธิบายการกำหนดค่า : ไวน์แดง
ขนาดการดาวน์โหลด :
82.23 KiB
ขนาดชุดข้อมูล :
626.17 KiB
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,599 |
- ตัวอย่าง ( tfds.as_dataframe ):