شراب_کیفیت

  • توضیحات :

دو مجموعه داده با استفاده از نمونه‌های شراب قرمز و سفید ایجاد شد. ورودی‌ها شامل آزمایش‌های عینی (مثلاً مقادیر PH) و خروجی براساس داده‌های حسی است (میانگین حداقل 3 ارزیابی انجام‌شده توسط کارشناسان شراب). هر متخصص کیفیت شراب را بین 0 (بسیار بد) و 10 (بسیار عالی) درجه بندی کرد. چندین روش داده کاوی برای مدل سازی این مجموعه داده ها تحت رویکرد رگرسیون به کار گرفته شد. مدل ماشین بردار پشتیبان بهترین نتایج را به دست آورد. چندین معیار محاسبه شد: MAD، ماتریس سردرگمی برای تحمل خطای ثابت (T)، و غیره. همچنین، ما اهمیت نسبی متغیرهای ورودی را رسم می‌کنیم (همانطور که با روش تحلیل حساسیت اندازه‌گیری می‌شود).

دو مجموعه داده مربوط به انواع قرمز و سفید شراب پرتغالی "Vinho Verde" است. برای جزئیات بیشتر، به: http://www.vinhoverde.pt/en/ یا مرجع [Cortez et al., 2009] مراجعه کنید. به دلیل حفظ حریم خصوصی و مسائل لجستیکی، فقط متغیرهای فیزیکوشیمیایی (ورودی ها) و حسی (خروجی) در دسترس هستند (به عنوان مثال هیچ اطلاعاتی در مورد انواع انگور، نام تجاری شراب، قیمت فروش شراب و غیره وجود ندارد).

تعداد موارد: شراب قرمز - 1599; شراب سفید - 4898

متغیرهای ورودی (بر اساس آزمایشات فیزیکوشیمیایی):

  1. اسیدیته ثابت
  2. اسیدیته فرار
  3. اسید سیتریک
  4. قند باقی مانده
  5. کلریدها
  6. دی اکسید گوگرد آزاد
  7. دی اکسید گوگرد کل
  8. تراکم
  9. pH
  10. سولفات ها
  11. الکل

متغیر خروجی (بر اساس داده های حسی):

  1. کیفیت (امتیاز بین 0 تا 10)
FeaturesDict({
    'features': FeaturesDict({
        'alcohol': float32,
        'chlorides': float32,
        'citric acid': float32,
        'density': float32,
        'fixed acidity': float32,
        'free sulfur dioxide': float32,
        'pH': float32,
        'residual sugar': float32,
        'sulphates': float64,
        'total sulfur dioxide': float32,
        'volatile acidity': float32,
    }),
    'quality': int32,
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
امکانات FeaturesDict
ویژگی ها / الکل تانسور float32
ویژگی ها/کلریدها تانسور float32
ویژگی ها / اسید سیتریک تانسور float32
ویژگی ها / تراکم تانسور float32
ویژگی ها / اسیدیته ثابت تانسور float32
ویژگی ها / دی اکسید گوگرد آزاد تانسور float32
ویژگی ها / pH تانسور float32
ویژگی ها/قند باقیمانده تانسور float32
ویژگی ها / سولفات ها تانسور float64
ویژگی ها / دی اکسید گوگرد کل تانسور float32
ویژگی ها / اسیدیته فرار تانسور float32
کیفیت تانسور int32
  • کلیدهای نظارت شده (نگاه کنید به as_supervised doc ): ('features', 'quality')

  • شکل ( tfds.show_examples ): پشتیبانی نمی شود.

  • نقل قول :

@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
    author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando;  Matos, Telmo;  Reis, Jose",
    title  = "Modeling wine preferences by data mining from physicochemical properties.",
    year   = "2009",
    url    = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}

wine_quality/white (پیکربندی پیش فرض)

  • توضیحات پیکربندی : شراب سفید

  • حجم دانلود : 258.23 KiB

  • حجم مجموعه داده : 1.87 MiB

  • تقسیم ها :

شکاف مثال ها
'train' 4,898

کیفیت_شراب/قرمز

  • توضیحات پیکربندی : شراب قرمز

  • حجم دانلود : 82.23 KiB

  • حجم مجموعه داده : 626.17 KiB

  • تقسیم ها :

شکاف مثال ها
'train' 1599