일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 통계학
- python
- Max
- 데이터전처리
- 한줄for문
- 가설검정
- Set
- Til
- 선형회귀
- 시각화
- 다중공선성
- map
- f-string
- 아티클스터디
- 반복문
- AB테스트
- 데이터시각화
- Join
- 태블로
- DATE_SUB
- SQL
- 이중for문
- Leetcode
- 내일배움캠프
- 프로그래머스
- 내일배움일지
- ★
- SQLD
- 내배캠_학습기록
- 리스트
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
1) 위치추정데이터의 중심을 파악하는 대표적인 방법 : 중앙값, 평균mean = np.mean(data)median = np.median(data) 2) 변이추정데이터들이 서로 얼마나 다른지 확인하는 방법 : 분산, 표준편차, 범위ex) 매출 데이터의 변이를 분석하여 비즈니스의 안정성을 평가범위(Range)란?가장 큰 값과 가장 작은 값의 차이가 어느 정도 되는가?범위를 통해 데이터가 어느 정도의 변동성을 가지는지 쉽게 파악할 수 있다.variance = np.var(data)std_dev = np.std(data)data_range = np.max(data) - np.min(data) 3) 데이터 분포 탐색데이터의 값들이 어떻게 이루어져 있는지 한눈에 확인하기plt.hist(data, bins=5)..
통계를 크게 두개로 나눌 수 있음.-> 기술통계와 추론통계 1) 기술통계대표값을 출력함으로써 데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용 대표값 간단 설명평균 (Mean)중앙값 (Median) : 데이터셋을 크기 순서대로 정렬했을 때 중앙에 위치한 값데이터에 이상치, 예외값이 많을 것 같다면, 대표값으로서 평균이 아닌 중앙값을 사용하는 것이 좋을 경우도 있음분산 (Variance) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 데이터의 흩어짐 정도분산이 크면 데이터가 넓게 퍼져 있음, 작으면 데이터가 평균에 가깝게 모여 있음표준편차 (Standard Deviation) : 평균으로부터 데이터가 얼마나 떨어져 있는지, 분산의 제곱근분산과 표준편차 둘 다 데이터의 분..
왜 통계를 배워야 하는가?데이터 기반의 의사결정을 내릴 수 있음 통계로 할 수 있는 것방대한 양의 데이터를 손쉽게, 명확하게 파악할 수 있는 방법이해, 해석, 요약, 패턴추론을 통해 결론을 도출하는 과정을 도움즉, 데이터 기반의 의사결정을 내릴 수 있음결국 기업이 보다 현명한 결정을 내리고 수익을 창출하기 위해 필요 통계를 활용한 데이터 분석은 필수다! 통계 사용의 예1) 고객 만족도 설문조사 분석2) 고객 유형별 세그먼트(Segment) 상품 추천-> 같은 그룹의 고객들끼리 같은 상품이나 서비스 추천을 하는 것이 용이하다.3) 기업의 전략을 수립등등...