일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 시각화
- DATE_SUB
- 내배캠_학습기록
- Til
- 데이터시각화
- Leetcode
- Set
- SQLD
- 내일배움일지
- ★
- 이중for문
- 아티클스터디
- 데이터전처리
- Join
- python
- 선형회귀
- 통계학
- 프로그래머스
- f-string
- 한줄for문
- 다중공선성
- map
- Max
- 내일배움캠프
- SQL
- 태블로
- AB테스트
- 리스트
- 반복문
- 가설검정
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
Histplotsns.histplot(data=df, x='Delay_from_due_date', hue='Credit_Mix', element='bars',palette=palette) element에 세가지 요소가 있음{“bars”(default), “step”, “poly”} https://seaborn.pydata.org/generated/seaborn.histplot.html seaborn.histplot — seaborn 0.13.2 documentationseaborn.histplot seaborn.histplot(data=None, *, x=None, y=None, hue=None, weights=None, stat='count', bins='auto', binwidth=None, b..
다른 팀께 제시해주신 방향 중 용이한 피드백이 많아서 정리해두고자 한다. 전처리 파트1) 결측치와 이상치94% 결측치를 가진 컬럼 -> 대부분의 팀이 컬럼 자체를 분석에서 제외우선 박스플롯을 그려본 후 이상치가 있음을 파악하고 이후 데이터를 일일이 확인하여 이상치 확인일반적으로 10% 이하 결측치는 대체하거나 삭제하고, 50% 이하는 대체한다. (질문 다시하기)결측치를 전부 삭제하지 않고 none, 0, 해당없음 등으로 분류-> 최대한 모든 데이터를 남기려는 과정에서 데이터 분석 시 편향을 줄일 수 있었을 것이다.이름과 같은 고유명사는 결측치를 처리하면 안됨 -> 식별자로 처리 2) 파생변수년월일로 구분된 컬럼 -> datetime 형식으로 압축주중, 주말로 구분된 컬럼 -> 전체 숙박일 수로 압축b..
제시되어 있는 기초 프로젝트 주제는 꽤 다양했는데, 기초 프로젝트에서 우리 팀은 은행 고객데이터를 이용한 서비스 분석을 진행했다. 오늘로서 기초 프로젝트는 마무리가 될 예정이라, 혼자서 재미로 할 만한 프로젝트 주제로는 무엇이 있을까 살펴보려 주제부터 다시 살펴보았다.결국 도메인 지식이 크게 중요하지는 않다. 입사한 후에 경험을 통해 얻어도 멀지 않다. ...는 조언을 들은 적이 있었기 때문에, 마케팅 성과 측정과 유저 행동 데이터 분석에서 고민하다가, 음악 플랫폼 유저 행동 데이터 분석을 위한 데이터셋을 자세히 살펴보기로 했다. 개요☑️ 행동 데이터(행동패턴) 분석은 모든 도메인에서 중요한 의미를 가지고 있습니다.☑️ 행동 데이터를 통해 고객의 니즈를 파악하고, 이에 맞춰 액션 플랜(추천)을 제공하기도..