노력에는 지름길이 없으니까요

2.6 카이제곱분포 본문

통계학

2.6 카이제곱분포

데건 2024. 8. 1. 16:39
728x90

독립성 검정이나 적합도 검정에 사용되는 분포!

 

출처 : 위키백과

여기서 K값은 자유도 (여기서 자유도란 표본의 크기와 관련이 있는 값이다 정도로 이해!)


카이제곱 분포란?

카이제곱분포는 범주형 데이터의 독립성 검정이나 적합도 검정에 사용되는 분포

특징
- 자유도에 따라 모양이 달라짐.
- 상관관계나 인과관계를 판별하고자 하는 원인의 독립변수가 ‘완벽하게 서로 다른 질적 자료’일 때 활용
    - ex) 성별이나 나이에 따른 선거 후보 지지율
범주형 데이터 분석에 사용

 

독립성 검정

범주형 변수 간의 관계가 있는지 확인할 때 사용됩니다.

예를 들어, 성별과 직업 선택 간의 독립성을 검토할 수 있습니다.

혹은, 성별이 후보 지지율에 영향을 끼치는지? 검토할 수도 있습니다.

 

적합도 검정

관측한 값들이 특정 분포에 해당하는지? 검정할 때 사용됩니다.

예를 들어, 주사위의 각 면이 동일한 확률로 나오는지 검토할 수 있습니다.

노란색 완두와 녹색완두가 3:1의 비율로 나와야 하는데 실험적으로 측정한 데이터가 그렇게 나오는지?

(독립성 검정과 적합도 검정은 이후에 자세히 배울 예정입니다)

 

# 카이제곱분포 생성
chi2_dist = np.random.chisquare(df=2, size=1000)

# 히스토그램으로 시각화
plt.hist(chi2_dist, bins=30, density=True, alpha=0.6, color='skyblue')

# 카이제곱분포 곡선 추가
x = np.linspace(0, 10, 100)
p = stats.chi2.pdf(x, df=2)
plt.plot(x, p, 'k', linewidth=2)
plt.title('chi2 distribution histogram')
plt.show()

 

728x90
반응형

'통계학' 카테고리의 다른 글

2.8 푸아송 분포  (0) 2024.08.01
2.7 이항분포  (0) 2024.08.01
2.5 스튜던트 t 분포  (0) 2024.08.01
2.3 정규분포 / 2.4 긴 꼬리 분포  (1) 2024.08.01
2-2) 표본오차와 신뢰구간  (0) 2024.08.01