AI의 편향은 모델의 체계적 불공정성을 가리킵니다 — 특정 집단을 부당하게 불리하게 하는 결과를 내며, 종종 훈련 데이터의 편향을 반영합니다. 편향된 AI가 실제 해를 끼치고 차별을 영속시킬 수 있으므로 이는 심각한 윤리적·실무적 우려입니다.
AI 편향이란
AI 편향 → model 출력의 체계적이고 불공정한 치우침:
→ model이 특정 집단을 불공정하게 대하거나(예: 인종, 성별, 연령) 치우친 결정을 내림
→ 대개 편향된 훈련 데이터에서 비롯됨(model이 데이터의 편향을 학습)
→ '편향을 넣으면 편향이 나옴' → model이 데이터의 사회적 편향을 반영하고 증폭할 수 있음
→ AI가 불공정/차별을 영속하거나 악화시킬 수 있음
편향이 어디서 오는가
✓ 편향된 데이터 → 훈련 데이터가 역사적/사회적 편향을 반영하거나 대표적이지 않음
→ 예: 한 집단을 선호하는 채용 데이터 → model이 그 집단을 선호하는 법을 학습
✓ 비대표적 데이터 → 과소대표된 집단 → 그들에 대한 부진한 성능
✓ 편향된 레이블, 결함 있는 문제 설정, 편향된 특성 → 불공정을 인코딩
→ 편향은 대부분 데이터(와 문제 설정 방식)에서 비롯됨
