일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 리스트
- 다중공선성
- DATE_SUB
- Set
- Leetcode
- 내일배움일지
- map
- Max
- Til
- 프로그래머스
- Join
- SQL
- 반복문
- 아티클스터디
- python
- 통계학
- 내일배움캠프
- 선형회귀
- 데이터시각화
- ★
- 태블로
- 데이터전처리
- 내배캠_학습기록
- f-string
- SQLD
- 가설검정
- 한줄for문
- 이중for문
- AB테스트
- 시각화
- Today
- Total
목록내일배움캠프 일지/팀 프로젝트2 (2)
노력에는 지름길이 없으니까요
데이터 구성customers= pd.read_csv('dataset/customers.csv')orders= pd.read_csv('dataset/orders.csv')order_items= pd.read_csv('dataset/order_items.csv')payments= pd.read_csv('dataset/payments.csv')products= pd.read_csv('dataset/products.csv') 사용할 수 있는 데이터셋은 크게 다섯가지이다.각 데이터셋의 컬럼 설명은 이하와 같다.더보기ordersorder_id: 주문 IDcustomer_id: 고객 IDorder_status: 주문 상태order_purchase_timestamp: 주문 구매 시간order_approved_at: 주..
우리가 놓치고 있는 중요한 고객의 패턴 확인 혹은 새로운 기준에 따라 유저 그룹화 특정 기준에 따라 군집화. 군집별 인사이트 도출 -> 서비스 반영에 대한 방향성 제시 주제- 데이터셋 현황 파악 - 다양한 조건(군집갯수, 컬럼갯수)을 통해 결과를 비교 - 군집(클러스터)별로 유의미한 특징을 살펴보고 이를 시각화 - 군집별 인사이트를 제시 설명- 각 테이블을 결합하여, 클러스터링을 위한 하나의 데이터셋으로 - 이상치 처리 기법을 활용하거나, 특정 기준을 세워 이상치를 정의 하고 그 이유를 설명 - 클러스터링시, 초기 군집의 갯수와 사용할 컬럼의 갯수는 python 머신러닝 라이브러리를 활용 - 컬럼별 raw data 분포 시각화 - 컬럼 간 상관계수를 히트맵 차트로 구현해주세요. (유의미한 기..