ما المقصود بمعالجة نموذج TensorFlow؟

إذا كنت قد حددت مخاوف تتعلق بالإنصاف في نموذج التعلم الآلي الخاص بك ، فهناك ثلاثة أنواع أساسية من التدخلات الفنية المتاحة:

  • التدريب على تقنيات المعالجة المسبقة للبيانات: جمع المزيد من البيانات ، وتوليد البيانات التركيبية ، وضبط أوزان الأمثلة ومعدلات أخذ العينات من الشرائح المختلفة.
  • تقنيات نمذجة وقت التدريب: تغيير النموذج نفسه عن طريق إدخال أو تعديل أهداف النموذج وإضافة قيود.
  • تقنيات ما بعد التدريب: تعديل مخرجات النموذج أو تفسير المخرجات لتحسين الأداء عبر المقاييس.
توفر مكتبة TensorFlow Model Remediation تقنيات وقت التدريب للتدخل في النموذج.

نمذجة وقت التدريب

توفر مكتبة TensorFlow Model Remediation طريقتين لمعالجة مشكلات التحيز والإنصاف في النموذج الخاص بك ، وهما MinDiff وإقران Logit Counterfactual Logit (CLP) . تم وصفها في الجدول أدناه.

حد أدنى CLP
متى يجب استخدام هذه التقنية؟

للتأكد من أن النموذج يتنبأ بالتسمية المفضلة بشكل متساوٍ لجميع قيم السمة الحساسة.

لتحقيق تكافؤ الفرص الجماعي.

للتأكد من أن تنبؤ النموذج لا يتغير بين "الأزواج المقابلة" (حيث تختلف السمة الحساسة المشار إليها في الميزة). على سبيل المثال ، في مصنف السمية ، لا ينبغي أن تحتوي أمثلة مثل "أنا رجل" و "أنا مثلية" على تنبؤ مختلف.

لتحقيق شكل من أشكال الإنصاف المضاد .

كيف يعمل؟ يعاقب النموذج أثناء التدريب للاختلافات في توزيع الدرجات بين المجموعتين. يعاقب النموذج أثناء التدريب لفروق الإخراج بين أزواج من الأمثلة المضاد.
طرائق الإدخال تعمل وظائف الخسارة على المخرجات ، لذا فهي ، من الناحية النظرية ، محايدة لمدخلات وبنية النموذج. تعمل وظائف الخسارة على المخرجات ، لذا فهي ، من الناحية النظرية ، محايدة لمدخلات وبنية النموذج.