일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 내일배움캠프
- 반복문
- 리스트
- map
- ★
- Set
- Join
- f-string
- 데이터시각화
- DATE_SUB
- AB테스트
- Max
- 태블로
- Leetcode
- 시각화
- 내배캠_학습기록
- 다중공선성
- 한줄for문
- SQL
- Til
- 가설검정
- 데이터전처리
- 아티클스터디
- SQLD
- python
- 통계학
- 이중for문
- 선형회귀
- 내일배움일지
- 프로그래머스
- Today
- Total
목록통계학 (24)
노력에는 지름길이 없으니까요
1) 표본오차와 신뢰구간이란?표본오차 (Sampling Error)- 표본에서 계산된 통계량과 모집단의 진짜 값 간의 차이. - 표본 크기가 클수록 표본오차는 작아짐. - 이는 표본이 모집단을 완벽하게 대표하지 못하기 때문에 발생하며, 표본의 크기와 표본 추출 방법에 따라 달라질 수 있습니다. - 표본의 크기: 표본의 크기가 클수록 표본오차는 줄어듭니다. 더 많은 데이터를 수집할수록 모집단을 더 잘 대표하게 됩니다. (적당한 타협점을 찾아야 함) - 표본 추출 방법: 무작위 추출 방법을 사용하면 표본오차를 줄일 수 있습니다. 모든 모집단 요소가 선택될 동등한 기회를 가지게 해야 합니다. (공평해야 한다.) 0으로 만들 수는 없지만, 두 방법을 사용하여 표본오차를 줄여야 한다. 신뢰구간 (Co..
모집단은 전체! 표본은 일부! ☑️ 모집단- 관심의 대상이 되는 전체 집단. ex) 한 국가의 모든 성인.☑️ 표본- 모집단에서 추출한 일부. ex) 그 국가의 성인 중 일부를 조사.1) 왜 표본을 사용하는가?현실적인 제약1. 비용과 시간 - 전체 모집단을 조사하는 것은 비용과 시간이 많이 들기 때문에 대부분의 경우 불가능하거나 비효율적입니다.표본 조사는 이러한 자원을 절약하면서도 유의미한 결과를 도출할 수 있는 방법입니다. 2. 접근성 - 모든 데이터를 수집하는 것이 물리적으로 불가능한 경우가 많습니다. 예를 들어, 특정 질병에 걸린 모든 환자의 데이터를 수집하는 것은 어려울 수 있습니다. 대표성1. 표본의 대표성 (표본이 모집단의 대표성을 가지고 있다!) - 잘 설계된 표본은 모집단의..
통계를 크게 두개로 나눌 수 있음.-> 기술통계와 추론통계 1) 기술통계대표값을 출력함으로써 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용 대표값 간단 설명평균 (Mean)중앙값 (Median) : 데이터셋을 크기 순서대로 정렬했을 때 중앙에 위치한 값데이터에 이상치, 예외값이 많을 것 같다면, 대표값으로서 평균이 아닌 중앙값을 사용하는 것이 좋을 경우도 있음분산 (Variance) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 데이터의 흩어짐 정도분산이 크면 데이터가 넓게 퍼져 있음, 작으면 데이터가 평균에 가깝게 모여 있음표준편차 (Standard Deviation) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 분산의 제곱근분산과 표준편차 둘 다 데이터의 분..
왜 통계를 배워야 하는가?데이터 기반의 의사결정을 내릴 수 있음 통계로 할 수 있는 것방대한 양의 데이터를 손쉽게, 명확하게 파악할 수 있는 방법이해, 해석, 요약, 패턴추론을 통해 결론을 도출하는 과정을 도움즉, 데이터 기반의 의사결정을 내릴 수 있음결국 기업이 보다 현명한 결정을 내리고 수익을 창출하기 위해 필요 통계를 활용한 데이터 분석은 필수다! 통계 사용의 예1) 고객 만족도 설문조사 분석2) 고객 유형별 세그먼트(Segment) 상품 추천-> 같은 그룹의 고객들끼리 같은 상품이나 서비스 추천을 하는 것이 용이하다.3) 기업의 전략을 수립등등...