일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- Set
- 반복문
- 내배캠_학습기록
- 내일배움캠프
- 내일배움일지
- 태블로
- 데이터시각화
- 아티클스터디
- 프로그래머스
- 가설검정
- Join
- Max
- 이중for문
- 한줄for문
- DATE_SUB
- python
- ★
- 데이터전처리
- AB테스트
- Leetcode
- SQLD
- 리스트
- 선형회귀
- 다중공선성
- Til
- 시각화
- SQL
- f-string
- 통계학
- map
- Today
- Total
노력에는 지름길이 없으니까요
3.6 제 1종 오류와 제 2종 오류 본문
두개를 구분하고 최대한 줄일 수 있도록 해야 함!!!
1) 제 1종 오류와 제 2종 오류는 무엇일까?
☑️ 제 1종 오류
귀무가설이 참인데 기각하는 오류
잘못된 긍정을 의미 (아무런 영향이 없는데 영향이 있다고 하는 것)
한 단어로 위양성!
α를 경계로 귀무가설을 기각하기 때문에 제1종 오류가 α만큼 발생
따라서 유의수준(α)을 정함으로써 제 1종 오류 제어 가능
만약, 유의수준이 0.05라면 100번 중 5번 정도 일어날 수 있는 제 1종 오류는 감수하겠다는 것
❓다중 검정시 제 1종 오류가 증가하는 이유? -> 보정을 해야하는 이유!
하나의 검정에서 제1종 오류가 발생하지 않을 확률은 1- α 입니다.
m개의 독립된 검정에서 제1종 오류가 전혀 발생하지 않을 확률은 (1- α)^m입니다.
따라서, m개의 검정에서 하나 이상의 제1종 오류가 발생할 확률(즉, 전체 제1종 오류율)은 1- (1- α)^m 입니다.
이 값은 m이 커질수록 빠르게 증가합니다. 예를 들어, α=0.05, m=10인 경우
1- (1- 0.05)^10 = 약 0.401
즉, 10개의 가설을 동시에 검정할 때 하나 이상의 가설에서 제 1종 오류가 발생할 확률이 약 40.1% 이므로 개별검증에서 발생하는 오류율(5%)보다 높습니다.
☑️ 제 2종 오류 (검정력)
귀무가설이 거짓인데 기각하지 않는 오류.
잘못된 부정을 의미 (영향이 있는데 영향이 없다고 하는 것)
한 단어로 위음성!
제 2종 오류가 일어날 확률은 β로 정의.
제 2종 오류가 일어나지 않을 확률은 검정력(1-β)으로 정의.
하지만 이를 직접 통제할 수는 없음.
그나마 통제를 해볼 수 있는 방법으로는…
표본크기 n이 커질 수록 β가 작아짐.
α와 β는 상충관계에 있어서 너무 낮은 α를 가지게 되면 β는 더욱 높아짐 -> 알파값을 무제한으로 낮춰도 안되는 이
☑️ 예시
새로운 약물이 효과가 없는데 있다고 결론 내리는 것(제 1종 오류).
효과가 있는데 없다고 결론 내리는 것(제 2종 오류).
'통계학' 카테고리의 다른 글
다중공선성이란? (0) | 2024.08.05 |
---|---|
4.1 단순선형회귀 (0) | 2024.08.05 |
3.5 카이제곱검정 (0) | 2024.08.02 |
3.4 다중검정 (0) | 2024.08.02 |
3.2 가설검정 (0) | 2024.08.02 |