250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 태블로
- Set
- Join
- 리스트
- 데이터전처리
- 가설검정
- 내일배움일지
- Til
- 선형회귀
- 프로그래머스
- 내배캠_학습기록
- 다중공선성
- SQL
- python
- Max
- SQLD
- DATE_SUB
- AB테스트
- 아티클스터디
- 내일배움캠프
- Leetcode
- f-string
- 반복문
- 통계학
- 데이터시각화
- 시각화
- 한줄for문
- ★
- 이중for문
- map
Archives
- Today
- Total
노력에는 지름길이 없으니까요
2.6 카이제곱분포 본문
728x90
독립성 검정이나 적합도 검정에 사용되는 분포!
출처 : 위키백과
여기서 K값은 자유도 (여기서 자유도란 표본의 크기와 관련이 있는 값이다 정도로 이해!)
카이제곱 분포란?
카이제곱분포는 범주형 데이터의 독립성 검정이나 적합도 검정에 사용되는 분포
특징
- 자유도에 따라 모양이 달라짐.
- 상관관계나 인과관계를 판별하고자 하는 원인의 독립변수가 ‘완벽하게 서로 다른 질적 자료’일 때 활용
- ex) 성별이나 나이에 따른 선거 후보 지지율
- 범주형 데이터 분석에 사용
독립성 검정
두 범주형 변수 간의 관계가 있는지 확인할 때 사용됩니다.
예를 들어, 성별과 직업 선택 간의 독립성을 검토할 수 있습니다.
혹은, 성별이 후보 지지율에 영향을 끼치는지? 검토할 수도 있습니다.
적합도 검정
관측한 값들이 특정 분포에 해당하는지? 검정할 때 사용됩니다.
예를 들어, 주사위의 각 면이 동일한 확률로 나오는지 검토할 수 있습니다.
노란색 완두와 녹색완두가 3:1의 비율로 나와야 하는데 실험적으로 측정한 데이터가 그렇게 나오는지?
(독립성 검정과 적합도 검정은 이후에 자세히 배울 예정입니다)
# 카이제곱분포 생성
chi2_dist = np.random.chisquare(df=2, size=1000)
# 히스토그램으로 시각화
plt.hist(chi2_dist, bins=30, density=True, alpha=0.6, color='skyblue')
# 카이제곱분포 곡선 추가
x = np.linspace(0, 10, 100)
p = stats.chi2.pdf(x, df=2)
plt.plot(x, p, 'k', linewidth=2)
plt.title('chi2 distribution histogram')
plt.show()
728x90
반응형
'통계학' 카테고리의 다른 글
2.8 푸아송 분포 (0) | 2024.08.01 |
---|---|
2.7 이항분포 (0) | 2024.08.01 |
2.5 스튜던트 t 분포 (0) | 2024.08.01 |
2.3 정규분포 / 2.4 긴 꼬리 분포 (1) | 2024.08.01 |
2-2) 표본오차와 신뢰구간 (0) | 2024.08.01 |