일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- SQL
- 한줄for문
- SQLD
- python
- 태블로
- f-string
- 내일배움캠프
- 프로그래머스
- 데이터시각화
- 데이터전처리
- Leetcode
- Til
- 반복문
- 시각화
- ★
- 아티클스터디
- 내일배움일지
- AB테스트
- 가설검정
- Max
- 통계학
- 내배캠_학습기록
- Join
- 다중공선성
- DATE_SUB
- Set
- 이중for문
- 선형회귀
- map
- 리스트
- Today
- Total
목록가설검정 (2)
노력에는 지름길이 없으니까요
이 데이터가 의미가 있다고 볼 수 있는지, ... 가설을 세워서 그걸 검정해보는 것... 문제 발생 -> 가설을 세움 -> 귀무가설, 대립가설로 분류하고 둘 중 하나를 선택해야 한다. (정반대 중 하나!) -> 선택해서 결론을 내리는 것임☑️ 가설검정표본 데이터를 통해 모집단의 가설을 검증하는 과정즉, 데이터가 특정 가설을 지지하는지 평가하는 과정귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정 데이터 분석시 두가지 전략을 취할 수 있음확증적 자료분석미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석탐색적 자료분석(EDA)가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것 ☑️ 단계귀무가설(H0)과 대립가설(H1) 설정유의수준(α) 결..
통계를 크게 두개로 나눌 수 있음.-> 기술통계와 추론통계 1) 기술통계대표값을 출력함으로써 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용 대표값 간단 설명평균 (Mean)중앙값 (Median) : 데이터셋을 크기 순서대로 정렬했을 때 중앙에 위치한 값데이터에 이상치, 예외값이 많을 것 같다면, 대표값으로서 평균이 아닌 중앙값을 사용하는 것이 좋을 경우도 있음분산 (Variance) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 데이터의 흩어짐 정도분산이 크면 데이터가 넓게 퍼져 있음, 작으면 데이터가 평균에 가깝게 모여 있음표준편차 (Standard Deviation) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 분산의 제곱근분산과 표준편차 둘 다 데이터의 분..