- תיאור :
נוצרו שני מערכי נתונים, תוך שימוש בדגימות יין אדום ולבן. התשומות כוללות בדיקות אובייקטיביות (למשל ערכי PH) והפלט מבוסס על נתונים תחושתיים (חציון של לפחות 3 הערכות שנעשו על ידי מומחי יין). כל מומחה דירג את איכות היין בין 0 (גרוע מאוד) ל-10 (מצוין מאוד). מספר שיטות כריית נתונים יושמו למודל של מערכי נתונים אלה בגישת רגרסיה. דגם המכונה הווקטורית התמיכה השיג את התוצאות הטובות ביותר. חושבו מספר מדדים: MAD, מטריצת בלבול לסובלנות שגיאה קבועה (T), וכו'. כמו כן, אנו משרטטים את החשיבות היחסית של משתני הקלט (כפי שנמדדו על ידי הליך ניתוח רגישות).
שני מערכי הנתונים קשורים לגרסאות אדומות ולבנות של היין הפורטוגזי "Vinho Verde". לפרטים נוספים, עיין: http://www.vinhoverde.pt/en/ או הפניה [Cortez et al., 2009]. בשל בעיות פרטיות ולוגיסטיות, זמינים רק משתנים פיזיקוכימיים (תשומות) ותחושתיים (התפוקה) (למשל, אין נתונים לגבי סוגי ענבים, מותג יין, מחיר מכירת יין וכו').
מספר מקרים: יין אדום - 1599; יין לבן - 4898
משתני קלט (מבוסס על מבחנים פיזיקוכימיים):
- חומציות קבועה
- חומציות נדיפה
- חוּמצַת לִימוֹן
- שאריות סוכר
- כלורידים
- דו תחמוצת הגופרית החופשית
- סך דו תחמוצת הגופרית
- צְפִיפוּת
- pH
- סולפטים
- כּוֹהֶל
משתנה פלט (מבוסס על נתונים תחושתיים):
- איכות (ציון בין 0 ל-10)
דף הבית : https://archive.ics.uci.edu/ml/datasets/wine+quality
קוד מקור :
tfds.structured.wine_quality.WineQuality
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תכונות | FeaturesDict | |||
תכונות/אלכוהול | מוֹתֵחַ | לצוף32 | ||
תכונות/כלורידים | מוֹתֵחַ | לצוף32 | ||
תכונות/חומצת לימון | מוֹתֵחַ | לצוף32 | ||
תכונות/צפיפות | מוֹתֵחַ | לצוף32 | ||
תכונות/חומציות קבועה | מוֹתֵחַ | לצוף32 | ||
תכונות / דו תחמוצת הגופרית ללא תשלום | מוֹתֵחַ | לצוף32 | ||
תכונות/pH | מוֹתֵחַ | לצוף32 | ||
תכונות/שאריות סוכר | מוֹתֵחַ | לצוף32 | ||
תכונות/סולפטים | מוֹתֵחַ | לצוף64 | ||
תכונות/סך הכל דו תחמוצת הגופרית | מוֹתֵחַ | לצוף32 | ||
תכונות/חומציות נדיפה | מוֹתֵחַ | לצוף32 | ||
איכות | מוֹתֵחַ | int32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):('features', 'quality')
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (תצורת ברירת מחדל)
תיאור תצורה : יין לבן
גודל הורדה :
258.23 KiB
גודל ערכת נתונים :
1.87 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 4,898 |
- דוגמאות ( tfds.as_dataframe ):
איכות_יין/אדום
תיאור תצורה : יין אדום
גודל הורדה :
82.23 KiB
גודל מערך נתונים :
626.17 KiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,599 |
- דוגמאות ( tfds.as_dataframe ):