노력에는 지름길이 없으니까요

240625 팀 프로젝트 진행 상황 본문

내일배움캠프 일지/팀 프로젝트

240625 팀 프로젝트 진행 상황

데건 2024. 7. 25. 13:01
728x90

 

1. Objective (목표)

  • 프로젝트 목표: 이 프로젝트의 주요 목표를 명확히 기술합니다. 어떤 문제를 해결하고자 하는지 또는 어떤 비즈니스 목표를 달성하려는지를 설명합니다.
  • 예상 결과물: 이 프로젝트를 통해 기대되는 결과물과 도출하고자 하는 인사이트를 명시합니다.
  • -> https://teamsparta.notion.site/6ded39d460844896bc5b68195e7826f7

2. Necessary data (데이터)

  • 데이터 소스: 사용할 데이터의 출처를 설명하고, 필요한 데이터 유형과 범위를 명시합니다.
  • 데이터 수집 계획: 데이터를 수집하기 위한 계획과 방법을 기술합니다. 데이터 수집의 정확성과 완전성을 보장하기 위한 조치를 고려합니다.

3. Analytics (분석)

  • 분석 방법: 사용할 데이터 분석 기법과 모델을 선정하고, 분석을 위한 절차를 설명합니다.
  • 데이터 처리: 데이터를 정제하고 전처리하는 방법을 기술하고, 분석에 필요한 데이터의 품질을 확인합니다.
  • 시각화 계획: 데이터를 시각적으로 표현하여 인사이트를 도출하는 계획을 제시합니다.

4. Interpretation (해석)

  • 분석 결과 해석: 분석 결과를 해석하고, 비즈니스에 어떻게 적용할 수 있는지를 설명합니다.
  • 인사이트 도출: 데이터에서 도출된 인사이트와 향후 전략 수립을 위한 제언을 제시합니다.

5. Report (보고)

  • 보고서 구조: 보고서의 구조와 형식을 정의하고, 어떤 정보를 포함할 것인지를 설명합니다.
  • 시각화 활용: 보고서에 사용할 시각화 도구 및 방법을 결정하고, 강조할 요소를 구체화합니다.
  • 보고서 작성 일정: 보고서 작성 및 발표 일정을 계획하고, 이를 관리할 방법을 기술합니다.

발표

1명이 진행, 시간은 10분 제한

 


스크럼 todo
1. 진행상황 공유 -> 안된 분들 계시면 같이 진행해요!
2. 전처리 방식 공유 -> 다른 전처리 방식이 더 유효할지에 대해 의견 나누고 수정하는 작업은 필요할 것 같습니다.

3. 담당 나누기 (전처리, 시각화, 고객 세분화 모델 작성 (2명), PT자료 작성자 + 발표)

 

시각화 -> 

모델 -> 

(궁금한 점: 데이터 시각화 종류가 시계열 차트, 히트맵, 분포도 로 되어 있는데, 이건 튜터님 피드백을 거친 건지?)

고객 세분화 -> ★각 고객에 대한 클러스터링을 의미하는지?

고객 세그먼트 출력 : 

 

나이 / 직업 / 연간 소득 / 월급 / 이자율 

 

대출

마감 -> 대출마감일 

신용도

미지불 채무

 

신용 기간

신용도

 

최소 결제금액

월 할부금 총액

월 투자금 총액

결제 성향

월간 잔액

 

명시해야 할 것

시각화

고객 세분화

상관분석

 

목표 :

은행 고객 세분화를 통해 각 고객 그룹의 특성과 필요에 맞춘 맞춤형 CRM 전략을 수립하여, 고객 만족도와 로열티를 향상시키고, 비용 효율성을 극대화하는 것을 목적으로 합니다.


1. 고객 데이터 분석 : 고객의 인구통계학적 정보, 거래 내역, 신용도 등을 분석하여 주요 고객 세그먼트를 식별합니다.

2. 맞춤형 CRM 전략 수립: 각 고객 세그먼트의 특성과 요구를 분석하여 세그먼트별 맞춤형 전략을 수립합니다.

-> 대출, 거래 등의 변수들을 특정 기준을 세워서 고객 분류를 해보고 어떤 고객 특성이 있는지 파악 -> 각 고객에 대한 마케팅 전략을 분석

3. 신용 관련 : 신용 관련 변수 분석 및 리스크 관리 : 1) 고객의 신용 관련 변수 분석을 통해 신용 등급에 영향을 미치는 변수를 파악하고, 2) 연체율이 높을 것으로 예상되는 고객을 관리하여 당사의 현금 유동성 리스크를 감소시킵니다.

 

 

1) 2)의 분석 방법 (Python으로!)

1) x : 어떤 x가 영향을 미치는지 -> 전부 다!

2) medium high low / 세개 집단의 특성 비교

3) groupby / 금) ANOVA, 카이스퀘어를 한 번 써보는 걸로

 

 

2) 상관분석 -> 빼도 되는 변수를 추리는 작업

 - 연속형 - > 집단형 식으로 변수 변환을 하는 것도 가능

 

3) 회귀분석 -> 로지스틱 회귀

x : 어떤 x가 영향을 미치는지 -> 전부 다!

y : 연속형인 것만 가능...?

 

1)2) -> 분석할 수 있는 코드 찾기

-> 이걸 어떻게 시각화할 지...

 

 

전처리 관련 넣을 자료

일원분산분석 : 세 집단 비교

집단 세개의 특정변수의 평균값, 비교값

- 박스플롯

 

one way - 독립변수 1개 (신용도 하나.->이걸 우리가 쓸것임)
two way - 독립변수 2개 (종속변수가 어떻게 차이나는지)

 

- 목표 : 주식 시장의 트랜드를 파악하고, 이를 통해 투자 전략을 수립하는 것

주식 시장의 트랜드는 무엇인가?

현재 상승세를 띠고 있는 주식 항목 (장기적, 단기적)

현재 많은 고객이 

★ 어떤 고객이 주식을 진행하고 있는가?

 

이에 따른 투자 전략은 무엇인가?

1, 2

- Annual_Income과 Monthly_Inhand_Salary*12의 차이에 중점을 두기

- 신용도, 신용 활용율을 활용하여?

- 신용도와 월간 잔액이 상관도가 있는지 (국내 신용도에는 직접적인 관련이 없는 듯 하지만)

- 대출 종류 관련 -> 대출을 안 받은 사람, 대출이 많은 사람 등등... -> 주택 자산 담보, 신용등급 상승을 위한 대출, 학자금 대출 등등... -> 어떤 컬럼과 엮어볼지...?

- 대출 종류에 따른 투자금 총액

- PT 폼

- PT 개요

 

해석 -> 전원

보고 -> 

발표 자료 준비 자체는 다같이 하는 게 맞다고 봅니다! 발표자가 총괄하되, 작업한 부분에 대한 ppt는 각자 만드는 걸로!

 

 

 

 

 

 

 

728x90
반응형