12월 7일 Women in ML 심포지엄 참석 지금 등록

TensorFlow 모델 수정이란 무엇입니까?

기계 학습 모델의 공정성 문제를 식별한 경우 세 가지 주요 유형의 기술 개입을 사용할 수 있습니다.

  • 데이터 전처리 기술 훈련: 더 많은 데이터 수집, 합성 데이터 생성, 예제 가중치 조정 및 다양한 조각의 샘플링 속도.
  • 훈련 시간 모델링 기법: 모델 목표를 도입하거나 변경하고 제약 조건을 추가하여 모델 자체를 변경합니다.
  • 훈련 후 기술: 모델의 출력 또는 출력의 해석을 수정하여 메트릭 전반의 성능을 개선합니다.
TensorFlow Model Remediation 라이브러리는 모델에 개입하기 위한 훈련 시간 기술을 제공합니다.

훈련 시간 모델링

TensorFlow 모델 수정 라이브러리는 모델의 편향 및 공정성 문제를 해결하기 위한 두 가지 기술인 MinDiffCounterfactual Logit Pairing(CLP) 을 제공합니다. 아래 표에 설명되어 있습니다.

MinDiff CLP
이 기술은 언제 사용해야 합니까?

모델이 민감한 속성의 모든 값에 대해 선호하는 레이블을 동일하게 잘 예측하도록 합니다.

그룹 기회 평등 을 달성하기 위해.

모델의 예측이 "반사실 쌍"(피처에서 참조하는 민감한 속성이 다른 경우) 간에 변경되지 않도록 합니다. 예를 들어, 독성 분류기 에서 "나는 남자입니다"와 "나는 레즈비언입니다"와 같은 예는 다른 예측을 가지지 않아야 합니다.

반사실적 공정성 의 형태를 달성하기 위해.

어떻게 작동합니까? 훈련 중 두 세트 간의 점수 분포 차이에 대해 모델에 불이익을 줍니다. 사실과 다른 예제 쌍 간의 출력 차이에 대해 훈련하는 동안 모델에 불이익을 줍니다.
입력 양식 손실 함수는 출력에서 ​​작동하므로 이론적으로 입력 및 모델 아키텍처에 영향을 받지 않습니다. 손실 함수는 출력에서 ​​작동하므로 이론적으로 입력 및 모델 아키텍처에 영향을 받지 않습니다.