- توضیحات :
دو مجموعه داده با استفاده از نمونههای شراب قرمز و سفید ایجاد شد. ورودیها شامل آزمایشهای عینی (مثلاً مقادیر PH) و خروجی براساس دادههای حسی است (میانگین حداقل 3 ارزیابی انجامشده توسط کارشناسان شراب). هر متخصص کیفیت شراب را بین 0 (بسیار بد) و 10 (بسیار عالی) درجه بندی کرد. چندین روش داده کاوی برای مدل سازی این مجموعه داده ها تحت رویکرد رگرسیون به کار گرفته شد. مدل ماشین بردار پشتیبان بهترین نتایج را به دست آورد. چندین معیار محاسبه شد: MAD، ماتریس سردرگمی برای تحمل خطای ثابت (T)، و غیره. همچنین، ما اهمیت نسبی متغیرهای ورودی را رسم میکنیم (همانطور که با روش تحلیل حساسیت اندازهگیری میشود).
دو مجموعه داده مربوط به انواع قرمز و سفید شراب پرتغالی "Vinho Verde" است. برای جزئیات بیشتر، به: http://www.vinhoverde.pt/en/ یا مرجع [Cortez et al., 2009] مراجعه کنید. به دلیل حفظ حریم خصوصی و مسائل لجستیکی، فقط متغیرهای فیزیکوشیمیایی (ورودی ها) و حسی (خروجی) در دسترس هستند (به عنوان مثال هیچ اطلاعاتی در مورد انواع انگور، نام تجاری شراب، قیمت فروش شراب و غیره وجود ندارد).
تعداد موارد: شراب قرمز - 1599; شراب سفید - 4898
متغیرهای ورودی (بر اساس آزمایشات فیزیکوشیمیایی):
- اسیدیته ثابت
- اسیدیته فرار
- اسید سیتریک
- قند باقی مانده
- کلریدها
- دی اکسید گوگرد آزاد
- دی اکسید گوگرد کل
- تراکم
- pH
- سولفات ها
- الکل
متغیر خروجی (بر اساس داده های حسی):
- کیفیت (امتیاز بین 0 تا 10)
صفحه اصلی : https://archive.ics.uci.edu/ml/datasets/wine+quality
کد منبع :
tfds.structured.wine_quality.WineQuality
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
ذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
امکانات | FeaturesDict | |||
ویژگی ها / الکل | تانسور | float32 | ||
ویژگی ها/کلریدها | تانسور | float32 | ||
ویژگی ها / اسید سیتریک | تانسور | float32 | ||
ویژگی ها / تراکم | تانسور | float32 | ||
ویژگی ها / اسیدیته ثابت | تانسور | float32 | ||
ویژگی ها / دی اکسید گوگرد آزاد | تانسور | float32 | ||
ویژگی ها / pH | تانسور | float32 | ||
ویژگی ها/قند باقیمانده | تانسور | float32 | ||
ویژگی ها / سولفات ها | تانسور | float64 | ||
ویژگی ها / دی اکسید گوگرد کل | تانسور | float32 | ||
ویژگی ها / اسیدیته فرار | تانسور | float32 | ||
کیفیت | تانسور | int32 |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('features', 'quality')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (پیکربندی پیش فرض)
توضیحات پیکربندی : شراب سفید
حجم دانلود :
258.23 KiB
حجم مجموعه داده :
1.87 MiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 4,898 |
- مثالها ( tfds.as_dataframe ):
کیفیت_شراب/قرمز
توضیحات پیکربندی : شراب قرمز
حجم دانلود :
82.23 KiB
حجم مجموعه داده :
626.17 KiB
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1599 |
- مثالها ( tfds.as_dataframe ):