통계적 평등

작성자

익명

작성일

2025.08.25

조회수

버전

📋 문서 버전

이 문서는 22개의 버전이 있습니다. 현재 버전 6을 보고 있습니다.

통계적 평등

개요

통계적 평등(Statistical Parity)은 인공지능I) 및 기계학습 모델의 공정성(Fairness)을 평가하는 데 사용되는 주요 기준 중 하나로, 특정 민감한 속성(예: 성별, 인종, 연령 등)에 관계없이 모델이 모든 집단에 대해 동일한 비율로 긍정적인 결과를 부여하는지를 측정합니다. 이 개념은 AI 시스템이 사회적 불평등을 심화시키지 않도록 보장하는 데 중요한 역할을 하며, 특히 채용, 대출 승인, 범죄 예측 등 민감한 의사결정 영역에서 그 중요성이 강조됩니다.

통계적 평등은 공정성의 여러 정의 중 하나로, 수학적으로 명확하게 정의될 수 있으며, 모델의 출력 결과를 기반으로 집단 간의 차이를 분석하는 데 유용합니다. 그러나 이 기준은 맥락에 따라 제한점을 가지며, 항상 이상적인 공정성 기준이 되지는 않습니다.

통계적 평등의 정의

통계적 평등은 다음과 같은 수학적 조건을 만족할 때 성립합니다:

정의: 주어진 예측 모델 ( \hat{Y} )과 민감한 속성 ( A ) (예: 인종, 성별)에 대해, 모든 집단 ( a )와 ( b )에 대해 다음이 성립하면 통계적 평등이 성립한다고 말한다.
[ P(\hat{Y} = 1 | A = a) = P(\hat{Y} = 1 | A = b) ]

즉, 모델이 특정 집단에 속한 개인이 긍정적인 결과(예: 대출 승인, 채용)를 받을 확률이 다른 집단과 동일해야 한다는 의미입니다.

예를 들어, 대출 심사 모델에서 남성과 여성에 대해 각각 승인률이 70%라면 통계적 평등이 유지되지만, 남성은 80%, 여성은 50%라면 통계적 평등이 위반됩니다.

통계적 평등의 계산 방법

통계적 평등을 평가하기 위해 다음과 같은 절차를 따릅니다:

민감한 속성 정의: 성별, 인종, 연령대 등 사회적으로 보호되어야 할 특성 선택.
긍정적 예측 비율 산정: 각 집단별로 모델이 긍정적인 결과(예: "승인됨")를 부여한 비율 계산.
비율 비교: 집단 간의 긍정적 예측 비율의 차이를 분석.

예시

집단	인원 수	승인된 수	승인률
A	1000	700	70%
B	800	560	70%

이 경우, 두 집단의 승인률이 동일하므로 통계적 평등이 성립합니다.

통계적 평등의 장점

단순성과 해석 용이성: 결과를 직관적으로 이해할 수 있으며, 정책 결정자나 일반 대중에게 쉽게 설명 가능.
형식적 공정성 보장: 특정 집단이 체계적으로 불리한 결과를 받는 상황을 방지할 수 있음.
규제 준수에 유리: EU AI Act, 미국의 알고리즘 공정성 가이드라인 등에서 요구하는 공정성 기준 중 일부와 일치.

한계 및 비판

통계적 평등은 직관적이지만 다음과 같은 문제점이 있습니다:

1. 성능과의 트레이드오프

모델이 정확하게 예측하려는 성과를 희생하면서까지 통계적 평등을 강제하면, 전체적인 성능이 저하될 수 있습니다. 예를 들어, 특정 집단에서 실제로 대출 상환 가능성이 낮은 경우에도 동일한 승인률을 유지하려면 오류가 증가할 수 있습니다.

2. 맥락 무시

통계적 평등은 결과의 분포만 고려하고, 실제 조건(예: 신용 점수, 소득)을 무시합니다. 이는 오히려 역차별로 이어질 수 있으며, 공정성의 본질과 거리가 있을 수 있습니다.

3. 다른 공정성 기준과의 충돌

동등한 정밀도(Equal Precision)
동등한 재현율(Equal Recall)
기회 균등(Equal Opportunity)

등 다른 공정성 기준과 동시에 만족하기 어려운 경우가 많습니다. 예를 들어, 통계적 평등을 만족하더라도 재현율이 특정 집단에서 낮다면, 그 집단의 적격자들이 불리하게 평가될 수 있습니다.

공정성 기준	설명	통계적 평등과의 관계
기회 균등(Equal Opportunity)	긍정 클래스에 속한 개인이 동일한 확률로 긍정 예측을 받아야 함	통계적 평등과 독립적이며, 동시에 만족 불가능한 경우 많음
평등한 정밀도(Equal Precision)	예측된 긍정 결과 중 실제 긍정 비율이 집단 간 동일해야 함	통계적 평등과 다름
개별 공정성(Individual Fairness)	유사한 개인은 유사한 결과를 받아야 함	집단 기반 평가가 아닌 개별 기반 평가

실무 적용 사례

금융 서비스: 대출 승인 모델에서 소수 집단의 승인률이 낮은 경우, 통계적 평등을 기준으로 모델 재조정.
채용 AI: 성별에 따라 추천률이 편향된 경우, 통계적 평등을 기준으로 후처리 기법 적용.
범죄 위험 예측(예: COMPAS): 특정 인종 집단에 높은 위험 점수를 부여하는 경우, 통계적 평등 분석을 통해 편향 여부 평가.

참고 자료 및 관련 문서

관련 용어

민감한 속성(Sensitive Attribute): 성별, 인종 등 사회적 불이익을 줄 수 있는 특성.
공정성 제약 조건(Fairness Constraints): 모델 학습 시 통계적 평등 등을 만족하도록 제약을 부여.
후처리(Post-processing): 모델 예측 후 결과를 조정하여 공정성을 향상.

통계적 평등은 AI 공정성 평가의 기초적인 출발점으로 유용하지만, 실제 적용 시 맥락과 다른 공정성 기준과의 균형을 고려하는 것이 중요합니다.

📝 마크다운 원본

이 문서의 마크다운 원본 내용입니다.

# 통계적 평등

## 개요

**통계적 평등**(Statistical Parity)은 인공지능I) 및 기계학습 모델의 **공정성**(Fairness)을 평가하는 데 사용되는 주요 기준 중 하나로, 특정 민감한 속성(예: 성별, 인종, 연령 등)에 관계없이 모델이 모든 집단에 대해 동일한 비율로 긍정적인 결과를 부여하는지를 측정합니다. 이 개념은 AI 시스템이 사회적 불평등을 심화시키지 않도록 보장하는 데 중요한 역할을 하며, 특히 채용, 대출 승인, 범죄 예측 등 민감한 의사결정 영역에서 그 중요성이 강조됩니다.

통계적 평등은 공정성의 여러 정의 중 하나로, 수학적으로 명확하게 정의될 수 있으며, 모델의 출력 결과를 기반으로 집단 간의 차이를 분석하는 데 유용합니다. 그러나 이 기준은 맥락에 따라 제한점을 가지며, 항상 이상적인 공정성 기준이 되지는 않습니다.

---

## 통계적 평등의 정의

통계적 평등은 다음과 같은 수학적 조건을 만족할 때 성립합니다:

> **정의**: 주어진 예측 모델 \( \hat{Y} \)과 민감한 속성 \( A \) (예: 인종, 성별)에 대해, 모든 집단 \( a \)와 \( b \)에 대해 다음이 성립하면 통계적 평등이 성립한다고 말한다.  
> \[
> P(\hat{Y} = 1 | A = a) = P(\hat{Y} = 1 | A = b)
> \]

즉, 모델이 특정 집단에 속한 개인이 긍정적인 결과(예: 대출 승인, 채용)를 받을 확률이 다른 집단과 동일해야 한다는 의미입니다.

예를 들어, 대출 심사 모델에서 남성과 여성에 대해 각각 승인률이 70%라면 통계적 평등이 유지되지만, 남성은 80%, 여성은 50%라면 통계적 평등이 위반됩니다.

---

## 통계적 평등의 계산 방법

통계적 평등을 평가하기 위해 다음과 같은 절차를 따릅니다:

1. **민감한 속성 정의**: 성별, 인종, 연령대 등 사회적으로 보호되어야 할 특성 선택.
2. **긍정적 예측 비율 산정**: 각 집단별로 모델이 긍정적인 결과(예: "승인됨")를 부여한 비율 계산.
3. **비율 비교**: 집단 간의 긍정적 예측 비율의 차이를 분석.

### 예시

| 집단 | 인원 수 | 승인된 수 | 승인률 |
|------|--------|----------|--------|
| A    | 1000   | 700      | 70%    |
| B    | 800    | 560      | 70%    |

이 경우, 두 집단의 승인률이 동일하므로 통계적 평등이 성립합니다.

---

## 통계적 평등의 장점

- **단순성과 해석 용이성**: 결과를 직관적으로 이해할 수 있으며, 정책 결정자나 일반 대중에게 쉽게 설명 가능.
- **형식적 공정성 보장**: 특정 집단이 체계적으로 불리한 결과를 받는 상황을 방지할 수 있음.
- **규제 준수에 유리**: EU AI Act, 미국의 알고리즘 공정성 가이드라인 등에서 요구하는 공정성 기준 중 일부와 일치.

---

## 한계 및 비판

통계적 평등은 직관적이지만 다음과 같은 문제점이 있습니다:

### 1. **성능과의 트레이드오프**
모델이 정확하게 예측하려는 성과를 희생하면서까지 통계적 평등을 강제하면, 전체적인 성능이 저하될 수 있습니다. 예를 들어, 특정 집단에서 실제로 대출 상환 가능성이 낮은 경우에도 동일한 승인률을 유지하려면 오류가 증가할 수 있습니다.

### 2. **맥락 무시**
통계적 평등은 결과의 분포만 고려하고, 실제 조건(예: 신용 점수, 소득)을 무시합니다. 이는 오히려 **역차별**로 이어질 수 있으며, 공정성의 본질과 거리가 있을 수 있습니다.

### 3. **다른 공정성 기준과의 충돌**
- **동등한 정밀도**(Equal Precision)
- **동등한 재현율**(Equal Recall)
- **기회 균등**(Equal Opportunity)

등 다른 공정성 기준과 동시에 만족하기 어려운 경우가 많습니다. 예를 들어, 통계적 평등을 만족하더라도 재현율이 특정 집단에서 낮다면, 그 집단의 적격자들이 불리하게 평가될 수 있습니다.

---

## 관련 공정성 기준과의 비교

| 공정성 기준 | 설명 | 통계적 평등과의 관계 |
|------------|------|------------------|
| **기회 균등**(Equal Opportunity) | 긍정 클래스에 속한 개인이 동일한 확률로 긍정 예측을 받아야 함 | 통계적 평등과 독립적이며, 동시에 만족 불가능한 경우 많음 |
| **평등한 정밀도**(Equal Precision) | 예측된 긍정 결과 중 실제 긍정 비율이 집단 간 동일해야 함 | 통계적 평등과 다름 |
| **개별 공정성**(Individual Fairness) | 유사한 개인은 유사한 결과를 받아야 함 | 집단 기반 평가가 아닌 개별 기반 평가 |

---

## 실무 적용 사례

- **금융 서비스**: 대출 승인 모델에서 소수 집단의 승인률이 낮은 경우, 통계적 평등을 기준으로 모델 재조정.
- **채용 AI**: 성별에 따라 추천률이 편향된 경우, 통계적 평등을 기준으로 후처리 기법 적용.
- **범죄 위험 예측**(예: COMPAS): 특정 인종 집단에 높은 위험 점수를 부여하는 경우, 통계적 평등 분석을 통해 편향 여부 평가.

---

## 참고 자료 및 관련 문서

- [Hardt, M., Price, E., & Srebro, N. (2016). Equality of Opportunity in Supervised Learning. *NeurIPS*.](https://arxiv.org/abs/1610.02442)
- [Verma, S., & Rubin, J. (2018). Fairness Definitions Explained. *IEEE International Workshop on Software Fairness*.](https://doi.org/10.1109/FAIR.2018.00008)
- [AI 공정성 프레임워크 (IBM AI Fairness 360)](https://aif360.mybluemix.net/)

---

## 관련 용어

- **민감한 속성**(Sensitive Attribute): 성별, 인종 등 사회적 불이익을 줄 수 있는 특성.
- **공정성 제약 조건**(Fairness Constraints): 모델 학습 시 통계적 평등 등을 만족하도록 제약을 부여.
- **후처리**(Post-processing): 모델 예측 후 결과를 조정하여 공정성을 향상.

---

통계적 평등은 AI 공정성 평가의 기초적인 출발점으로 유용하지만, 실제 적용 시 맥락과 다른 공정성 기준과의 균형을 고려하는 것이 중요합니다.

AI 생성 콘텐츠 안내

이 문서는 AI 모델(qwen-3-235b-a22b-instruct-2507)에 의해 생성된 콘텐츠입니다.

주의사항: AI가 생성한 내용은 부정확하거나 편향된 정보를 포함할 수 있습니다. 중요한 결정을 내리기 전에 반드시 신뢰할 수 있는 출처를 통해 정보를 확인하시기 바랍니다.

위키너와나

통계적 평등

📋 문서 버전

통계적 평등

개요

통계적 평등의 정의

통계적 평등의 계산 방법

예시

통계적 평등의 장점

한계 및 비판

1. 성능과의 트레이드오프

2. 맥락 무시

3. 다른 공정성 기준과의 충돌

관련 공정성 기준과의 비교

실무 적용 사례

참고 자료 및 관련 문서

관련 용어

📝 마크다운 원본

🤔 AI의 사고 과정

이 AI 생성 콘텐츠가 도움이 되었나요?