일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- DATE_SUB
- python
- 가설검정
- 프로그래머스
- 데이터시각화
- 한줄for문
- f-string
- SQL
- Leetcode
- Set
- 데이터전처리
- Max
- Join
- SQLD
- ★
- map
- 리스트
- 태블로
- 반복문
- 내일배움캠프
- 이중for문
- Til
- AB테스트
- 내배캠_학습기록
- 다중공선성
- 통계학
- 시각화
- 선형회귀
- 아티클스터디
- 내일배움일지
- Today
- Total
목록신뢰구간 (2)
노력에는 지름길이 없으니까요
1) 표본오차와 신뢰구간이란?표본오차 (Sampling Error)- 표본에서 계산된 통계량과 모집단의 진짜 값 간의 차이. - 표본 크기가 클수록 표본오차는 작아짐. - 이는 표본이 모집단을 완벽하게 대표하지 못하기 때문에 발생하며, 표본의 크기와 표본 추출 방법에 따라 달라질 수 있습니다. - 표본의 크기: 표본의 크기가 클수록 표본오차는 줄어듭니다. 더 많은 데이터를 수집할수록 모집단을 더 잘 대표하게 됩니다. (적당한 타협점을 찾아야 함) - 표본 추출 방법: 무작위 추출 방법을 사용하면 표본오차를 줄일 수 있습니다. 모든 모집단 요소가 선택될 동등한 기회를 가지게 해야 합니다. (공평해야 한다.) 0으로 만들 수는 없지만, 두 방법을 사용하여 표본오차를 줄여야 한다. 신뢰구간 (Co..
통계를 크게 두개로 나눌 수 있음.-> 기술통계와 추론통계 1) 기술통계대표값을 출력함으로써 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용 대표값 간단 설명평균 (Mean)중앙값 (Median) : 데이터셋을 크기 순서대로 정렬했을 때 중앙에 위치한 값데이터에 이상치, 예외값이 많을 것 같다면, 대표값으로서 평균이 아닌 중앙값을 사용하는 것이 좋을 경우도 있음분산 (Variance) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 데이터의 흩어짐 정도분산이 크면 데이터가 넓게 퍼져 있음, 작으면 데이터가 평균에 가깝게 모여 있음표준편차 (Standard Deviation) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 분산의 제곱근분산과 표준편차 둘 다 데이터의 분..