일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 선형회귀
- 이중for문
- 아티클스터디
- 한줄for문
- 내일배움캠프
- python
- 데이터시각화
- Set
- Join
- 통계학
- SQLD
- 반복문
- AB테스트
- 리스트
- 데이터전처리
- 시각화
- 태블로
- Leetcode
- SQL
- 내배캠_학습기록
- 내일배움일지
- f-string
- 가설검정
- DATE_SUB
- 다중공선성
- map
- 프로그래머스
- Til
- ★
- Max
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
두개를 구분하고 최대한 줄일 수 있도록 해야 함!!! 1) 제 1종 오류와 제 2종 오류는 무엇일까?☑️ 제 1종 오류귀무가설이 참인데 기각하는 오류잘못된 긍정을 의미 (아무런 영향이 없는데 영향이 있다고 하는 것)한 단어로 위양성!α를 경계로 귀무가설을 기각하기 때문에 제1종 오류가 α만큼 발생따라서 유의수준(α)을 정함으로써 제 1종 오류 제어 가능만약, 유의수준이 0.05라면 100번 중 5번 정도 일어날 수 있는 제 1종 오류는 감수하겠다는 것 ❓다중 검정시 제 1종 오류가 증가하는 이유? -> 보정을 해야하는 이유!하나의 검정에서 제1종 오류가 발생하지 않을 확률은 1- α 입니다.m개의 독립된 검정에서 제1종 오류가 전혀 발생하지 않을 확률은 (1- α)^m입니다.따라서, m개의 검정에서 하나..
카이제곱검정범주형 데이터의 분석에 사용한다!!! - 범주형 데이터의 표본 분포가 모집단 분포와 일치하는지 검정(적합도 검정)하거나 - 두 범주형 변수 간의 독립성을 검정(독립성 검정) 적합도, 독립성 검정에 따라 사용하는 함수가 다르다!☑️ 적합도 검정 -> stats.chisquare관찰된 분포와 기대된 분포가 일치하는지 검정p값이 높으면 데이터가 귀무 가설에 잘 맞음. 즉, 관찰된 데이터와 귀무 가설이 적합p값이 낮으면 데이터가 귀무 가설에 잘 맞지 않음. 즉, 관찰된 데이터와 귀무 가설이 부적합 stats.chisquare카이제곱 적합도 검정을 수행하여 관찰된 빈도 분포가 기대된 빈도 분포와 일치하는지 평가 ☑️ 독립성 검정 -> stats.chi2_contingency두 범주형 변수 간의 독립성을..
☑️ 다중검정여러 가설을 동시에 검정할 때 발생하는 문제각 검정마다 유의수준을 조정하지 않으면 1종 오류(귀무가설이 참인데 기각하는 오류) 발생 확률이 증가1종 오류가 무엇인지랑 왜 다중검정시 발생확률이 증가하는지는 밑에서 다시 설명! 지금은, 어떤 오류가 발생할 수 있다는 정도로 이해! ☑️ 보정 방법본페로니 보정, 튜키 보정, 던넷 보정, 윌리엄스 보정 등이 있음가장 대표적이고 기본적인게 본페로니 보정 import numpy as npimport scipy.stats as stats# 세 그룹의 데이터 생성np.random.seed(42)group_A = np.random.normal(10, 2, 30)group_B = np.random.normal(12, 2, 30)group_C = np.rand..