노력에는 지름길이 없으니까요

1) 캐글 데이터 살펴보기 본문

개인 프로젝트

1) 캐글 데이터 살펴보기

데건 2024. 7. 31. 13:42
728x90

 

제시되어 있는 기초 프로젝트 주제는 꽤 다양했는데, 기초 프로젝트에서 우리 팀은 은행 고객데이터를 이용한 서비스 분석을 진행했다. 오늘로서 기초 프로젝트는 마무리가 될 예정이라, 혼자서 재미로 할 만한 프로젝트 주제로는 무엇이 있을까 살펴보려 주제부터 다시 살펴보았다.

결국 도메인 지식이 크게 중요하지는 않다. 입사한 후에 경험을 통해 얻어도 멀지 않다. ...는 조언을 들은 적이 있었기 때문에, 마케팅 성과 측정과 유저 행동 데이터 분석에서 고민하다가, 음악 플랫폼 유저 행동 데이터 분석을 위한 데이터셋을 자세히 살펴보기로 했다.

 

개요

☑️ 행동 데이터(행동패턴) 분석은 모든 도메인에서 중요한 의미를 가지고 있습니다.

☑️ 행동 데이터를 통해 고객의 니즈를 파악하고, 이에 맞춰 액션 플랜(추천)을 제공하기도 합니다.

☑️ 해당 프로젝트의 목적은 데이터 EDA 를 진행하고 결과를 도출하는(보여주는) 것으로 생각해주세요.

 

배경

☑️ ‘어쩌구저쩌구’ 회사에 다니는 데이터분석가 ‘아무개’는 새로운 프로젝트를 맡게 되었어요. 
☑️ 프로젝트 요청사항은 아래와 같아요. 
- 고객의 행동데이터를 탐색하여, 타 부서에게 서비스 현황을 볼 수 있게 해주세요.
- 우리의 서비스가 앞으로 어떠한 방향으로 나아갈 지 확인할 수 있었으면 좋겠어요.

 

주제

☑️ “음악플랫폼 데이터에 대한 EDA 진행, 서비스 현황 확인 및 개선점 제시” 로 생각해주세요.

☑️ 주어진 데이터를 활용하여 EDA 를 진행하여 아래 항목에 대한 확인이 가능하면 더더욱 좋겠죠?

  • 서비스의 현 상태 확인
  • 이슈사항 확인
  • 고객 세그먼트화(특정 기준에 따라 유저를 나눔)
    • 사용자의 연령과 성별, 고객 행동 패턴에 따라 코호트를 나누어 분석하면 다양한 인사이트가 나올 수 있어요!
  • 변수 간의 상관관계 확인, Heatmap 등으로 시각화, 분포 확인 등을 진행해볼 수 있어요.
  • 다양한 지표를 설계할 수 있어요.
  • Action Item 등의 인사이트 제공

 

사용한 데이터셋

https://www.kaggle.com/datasets/meeraajayakumar/spotify-user-behavior-dataset?resource=download

 

Spotify User Behavior Dataset

A Comprehensive Spotify Dataset for User Analysis

www.kaggle.com

 

 

 

 

 

Age
사용자의 연령층?
Gender
사용자의 성별은?
spotify_usage_period
spotify_usage_기간 - Spotify를 사용한 지 얼마나 되었나요?
spotify_listening_device
spotify_listening_device - 다음 중 Spotify를 청취할 때 주로 사용하는 장치는 무엇입니까?
spotify_subscription_plan
spotify_subscription_plan - 현재 어떤 Spotify 구독 계획을 갖고 계시나요?
premium_sub_willingness
premium_sub_willingness - 프리미엄 구독을 하시겠습니까, 아니면 앞으로도 프리미엄 구독을 계속할 의향이 있습니까?
preffered_premium_plan
prefered_premium_plan - 프리미엄이거나 프리미엄을 받을 의향이 있는 경우 구독료로 얼마를 지불합니까?
preferred_listening_content
preferred_listening_content - 무엇을 더 듣고 싶나요?
fav_music_genre
fav_music_genre - 어떤 장르의 음악을 가장 좋아하시나요?
music_time_slot
music_time_slot - 가장 좋아하는 음악 감상 시간은 언제인가요?
music_Influencial_mood
music_Influencial_mood - 음악을 들을 때 다음 중 어떤 기분이나 상황이 음악 선택에 가장 큰 영향을 미치나요?
music_lis_frequency
music_lis_주파수 - 언제 음악을 더 자주 듣나요?
music_expl_method
music_expl_method - Spotify에서 새로운 음악을 어떻게 발견하나요?
music_recc_rating
music_recc_ating - Spotify 음악 추천을 어떻게 평가하시나요?
pod_lis_frequency
pod_lis_주파수 - 팟캐스트를 얼마나 자주 듣나요?
fav_pod_genre
fav_pod_genre - 팟캐스트 중 어떤 장르를 가장 좋아하시나요?
preffered_pod_format
prefered_pod_format - 일반적으로 선호하는 팟캐스트 형식은 무엇입니까?
pod_host_preference
pod_host_preference - 알려지지 않은 인물의 팟캐스트를 듣는 것을 더 선호합니까, 아니면 유명인이 호스팅하는 팟캐스트를 선호합니까?
preffered_pod_duration
prefered_pod_duration - 짧은 팟캐스트 에피소드(30분 미만) 또는 긴 에피소드(30분 이상)를 선호합니까?
pod_variety_satisfaction
pod_variety_satisfaction - Spotify의 팟캐스트의 다양성과 가용성에 만족하시나요?

 

 

데이터가 어떤 식으로 구성되어 있는지 이 다음에 살펴봐야겠다.

728x90
반응형

'개인 프로젝트' 카테고리의 다른 글

2) 데이터 확인 (1)  (0) 2024.08.05