일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- Set
- ★
- AB테스트
- 시각화
- 아티클스터디
- 선형회귀
- Leetcode
- SQL
- f-string
- 한줄for문
- 프로그래머스
- 반복문
- 태블로
- 이중for문
- 내배캠_학습기록
- Til
- 가설검정
- DATE_SUB
- Max
- 내일배움캠프
- 다중공선성
- map
- python
- Join
- SQLD
- 통계학
- 데이터전처리
- 내일배움일지
- 데이터시각화
- 리스트
- Today
- Total
목록2024/07 (81)
노력에는 지름길이 없으니까요
오늘 목표프로젝트 정리 (설명서, 코드)코드카타 한 개 이상SQL 응용 강의 정리캐글 데이터 좀 더 살펴보기SQLD 3-1팀 프로젝트 피드백 정리 강의 내용캐글 데이터 살펴보기https://young-1-2.tistory.com/136 1) 캐글 데이터 살펴보기제시되어 있는 기초 프로젝트 주제는 꽤 다양했는데, 기초 프로젝트에서 우리 팀은 은행 고객데이터를 이용한 서비스 분석을 진행했다. 오늘로서 기초 프로젝트는 마무리가 될 예정이라, 혼자young-1-2.tistory.com 코드카타 Python, level 0 https://young-1-2.tistory.com/134 SQLD엔터티란?https://young-1-2.tistory.com/135 SQLD 3-1) 엔티티 (Entity)엔티티 (..
Histplotsns.histplot(data=df, x='Delay_from_due_date', hue='Credit_Mix', element='bars',palette=palette) element에 세가지 요소가 있음{“bars”(default), “step”, “poly”} https://seaborn.pydata.org/generated/seaborn.histplot.html seaborn.histplot — seaborn 0.13.2 documentationseaborn.histplot seaborn.histplot(data=None, *, x=None, y=None, hue=None, weights=None, stat='count', bins='auto', binwidth=None, b..
다른 팀께 제시해주신 방향 중 용이한 피드백이 많아서 정리해두고자 한다. 전처리 파트1) 결측치와 이상치94% 결측치를 가진 컬럼 -> 대부분의 팀이 컬럼 자체를 분석에서 제외우선 박스플롯을 그려본 후 이상치가 있음을 파악하고 이후 데이터를 일일이 확인하여 이상치 확인일반적으로 10% 이하 결측치는 대체하거나 삭제하고, 50% 이하는 대체한다. (질문 다시하기)결측치를 전부 삭제하지 않고 none, 0, 해당없음 등으로 분류-> 최대한 모든 데이터를 남기려는 과정에서 데이터 분석 시 편향을 줄일 수 있었을 것이다.이름과 같은 고유명사는 결측치를 처리하면 안됨 -> 식별자로 처리 2) 파생변수년월일로 구분된 컬럼 -> datetime 형식으로 압축주중, 주말로 구분된 컬럼 -> 전체 숙박일 수로 압축b..
제시되어 있는 기초 프로젝트 주제는 꽤 다양했는데, 기초 프로젝트에서 우리 팀은 은행 고객데이터를 이용한 서비스 분석을 진행했다. 오늘로서 기초 프로젝트는 마무리가 될 예정이라, 혼자서 재미로 할 만한 프로젝트 주제로는 무엇이 있을까 살펴보려 주제부터 다시 살펴보았다.결국 도메인 지식이 크게 중요하지는 않다. 입사한 후에 경험을 통해 얻어도 멀지 않다. ...는 조언을 들은 적이 있었기 때문에, 마케팅 성과 측정과 유저 행동 데이터 분석에서 고민하다가, 음악 플랫폼 유저 행동 데이터 분석을 위한 데이터셋을 자세히 살펴보기로 했다. 개요☑️ 행동 데이터(행동패턴) 분석은 모든 도메인에서 중요한 의미를 가지고 있습니다.☑️ 행동 데이터를 통해 고객의 니즈를 파악하고, 이에 맞춰 액션 플랜(추천)을 제공하기도..
엔티티 (Entity)데이터로 나타내고 싶은 하나의 개체 ☑️ 엔터티의 개념엔터티는 개체라고 표현하며 정보의 세계에서 의미 있는 하나의 정보 단위를 뜻합니다.사물의 본질적인 성질을 '속성'이라고 하며, 관련 있는 속성들이 모여서 의미 있는 하나의 정보 단위를 이룬 것이 바로 개체에 해당합니다. 데이터베이스에서 레코드가 개체에 해당합니다.개체 사이의 연관성을 관계라고 하며, 개체와 관계를 나타낸 모델을 개체 관계 모델(Entity-Relationship model)이라고 합니다.엔터티의 사전적 의미는 ‘독립체’이며 쉽게 말해 업무에서 쓰이는 데이터들을 분류한 그룹이라고 할 수 있습니다. 표기법 종류IEBarker 엔티티는 인스턴스의 집합이다.테이블에 들어있는 각각의 데이터가 인스턴스라고 말해도 상관없다..
해결일언어레벨 테스트명 20240730Pythonlevel 0 배열의 원소만큼 추가하기 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/181861 내 코드def solution(arr): return [i for i in arr for j in range(i)] 이중for문 연습했다. 이중for문 틀은 아래에 기재해둠!https://young-1-2.tistory.com/133 Python 이중 for문 작성법외웠다고 생각했는데 막상 쓰려니까 잘 되지 않아서 작성해둔다. for i in v: for j in i: print(j)[j for i in v for j in i]for inner in outer: for last..
외웠다고 생각했는데 막상 쓰려니까 잘 되지 않아서 작성해둔다. for i in v: for j in i: print(j)[j for i in v for j in i]for inner in outer: for last in inner_list: print(last)[last for inner in outer for last in inner]
오늘 목표팀 프로젝트 시각화 마치기그래프 색상 조사기초통계 출력 완료하기가능하다면 통계분석 패키지로 데이터 돌리기 -> 불가능했다마크다운 정리해두기 강의 내용https://young-1-2.tistory.com/131 kde 그래프에 대해서 조언을 받아서 주말에 한 번 그려봐야겠다. 주말동안 할 일...1. 금요일 저녁에 한 태스크 정리해서 팀원분들 보내드리기2. kde 그래프 그려보기3. 결론 비어있는 란 정리해두기
고객 데이터 분석 : 고객의 인구통계학적 정보, 거래 내역, 신용도 등을 분석하여 주요 고객 세그먼트를 식별합니다.맞춤형 CRM 전략 수립: 각 고객 세그먼트의 특성과 요구를 분석하여 세그먼트별 맞춤형 전략을 수립합니다.신용 관련 변수 분석 및 리스크 관리 : 고객의 신용 관련 변수 분석을 통해 신용 등급에 영향을 미치는 변수를 파악하고, 연체율이 높을 것으로 예상되는 고객을 관리하여 당사의 현금 유동성 리스크를 감소시킵니다.Task- 모든 그래프에 대해서 범주 색상은 통일 (B/G/S)- 색상 변환할지 말지 결정 💡 프로젝트 흐름 파트1 ) 1~3파트2) 4, 5시작목차 …목적, 목표 … etc전체 데이터 개요 제시데이터 소개 → Bank Databad와 good의 값 비교 (데이터 자체는 3군 모두..