일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- SQLD
- ★
- 통계학
- DATE_SUB
- map
- 프로그래머스
- 한줄for문
- 아티클스터디
- 가설검정
- 반복문
- AB테스트
- Leetcode
- f-string
- 선형회귀
- 데이터전처리
- 내일배움캠프
- 내배캠_학습기록
- python
- Til
- 시각화
- 다중공선성
- SQL
- 내일배움일지
- 리스트
- 이중for문
- 태블로
- Set
- 데이터시각화
- Max
- Join
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
정규분포란?정규분포는 종 모양의 대칭 분포로, 대부분의 데이터가 평균 주위에 몰려 있는 분포입니다.평균을 중심으로 좌우 대칭이며, 평균에서 멀어질수록 데이터의 빈도가 감소합니다.표준편차는 분포의 퍼짐 정도를 나타냅니다.특징대부분의 데이터가 평균 주변에 몰려 있으며, 평균에서 멀어질수록 빈도가 줄어듦.대부분의 데이터는 중심극한정리에 의해 데이터 수가 많아질수록 정규분포를 따르게 된다. -> 데이터 수가 충분하면 정규분포를 따른다고 가정해도 상관없다. # 정규분포 생성normal_dist = np.random.normal(170, 10, 1000)# 히스토그램으로 시각화plt.hist(normal_dist, bins=30, density=True, alpha=0.6, color='skyblue')# 정규분포..
1) 표본오차와 신뢰구간이란?표본오차 (Sampling Error)- 표본에서 계산된 통계량과 모집단의 진짜 값 간의 차이. - 표본 크기가 클수록 표본오차는 작아짐. - 이는 표본이 모집단을 완벽하게 대표하지 못하기 때문에 발생하며, 표본의 크기와 표본 추출 방법에 따라 달라질 수 있습니다. - 표본의 크기: 표본의 크기가 클수록 표본오차는 줄어듭니다. 더 많은 데이터를 수집할수록 모집단을 더 잘 대표하게 됩니다. (적당한 타협점을 찾아야 함) - 표본 추출 방법: 무작위 추출 방법을 사용하면 표본오차를 줄일 수 있습니다. 모든 모집단 요소가 선택될 동등한 기회를 가지게 해야 합니다. (공평해야 한다.) 0으로 만들 수는 없지만, 두 방법을 사용하여 표본오차를 줄여야 한다. 신뢰구간 (Co..
모집단은 전체! 표본은 일부! ☑️ 모집단- 관심의 대상이 되는 전체 집단. ex) 한 국가의 모든 성인.☑️ 표본- 모집단에서 추출한 일부. ex) 그 국가의 성인 중 일부를 조사.1) 왜 표본을 사용하는가?현실적인 제약1. 비용과 시간 - 전체 모집단을 조사하는 것은 비용과 시간이 많이 들기 때문에 대부분의 경우 불가능하거나 비효율적입니다.표본 조사는 이러한 자원을 절약하면서도 유의미한 결과를 도출할 수 있는 방법입니다. 2. 접근성 - 모든 데이터를 수집하는 것이 물리적으로 불가능한 경우가 많습니다. 예를 들어, 특정 질병에 걸린 모든 환자의 데이터를 수집하는 것은 어려울 수 있습니다. 대표성1. 표본의 대표성 (표본이 모집단의 대표성을 가지고 있다!) - 잘 설계된 표본은 모집단의..