일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 프로그래머스
- 내일배움캠프
- 데이터전처리
- SQLD
- 내배캠_학습기록
- AB테스트
- Join
- 시각화
- 리스트
- f-string
- DATE_SUB
- 한줄for문
- 다중공선성
- 태블로
- 내일배움일지
- python
- ★
- 아티클스터디
- Max
- 데이터시각화
- SQL
- 이중for문
- 가설검정
- Til
- Set
- Leetcode
- map
- 선형회귀
- 통계학
- 반복문
- Today
- Total
노력에는 지름길이 없으니까요
1) 캐글 데이터 살펴보기 본문
제시되어 있는 기초 프로젝트 주제는 꽤 다양했는데, 기초 프로젝트에서 우리 팀은 은행 고객데이터를 이용한 서비스 분석을 진행했다. 오늘로서 기초 프로젝트는 마무리가 될 예정이라, 혼자서 재미로 할 만한 프로젝트 주제로는 무엇이 있을까 살펴보려 주제부터 다시 살펴보았다.
결국 도메인 지식이 크게 중요하지는 않다. 입사한 후에 경험을 통해 얻어도 멀지 않다. ...는 조언을 들은 적이 있었기 때문에, 마케팅 성과 측정과 유저 행동 데이터 분석에서 고민하다가, 음악 플랫폼 유저 행동 데이터 분석을 위한 데이터셋을 자세히 살펴보기로 했다.
개요
☑️ 행동 데이터(행동패턴) 분석은 모든 도메인에서 중요한 의미를 가지고 있습니다.
☑️ 행동 데이터를 통해 고객의 니즈를 파악하고, 이에 맞춰 액션 플랜(추천)을 제공하기도 합니다.
☑️ 해당 프로젝트의 목적은 데이터 EDA 를 진행하고 결과를 도출하는(보여주는) 것으로 생각해주세요.
배경
☑️ ‘어쩌구저쩌구’ 회사에 다니는 데이터분석가 ‘아무개’는 새로운 프로젝트를 맡게 되었어요.
☑️ 프로젝트 요청사항은 아래와 같아요.
- 고객의 행동데이터를 탐색하여, 타 부서에게 서비스 현황을 볼 수 있게 해주세요.
- 우리의 서비스가 앞으로 어떠한 방향으로 나아갈 지 확인할 수 있었으면 좋겠어요.
주제
☑️ “음악플랫폼 데이터에 대한 EDA 진행, 서비스 현황 확인 및 개선점 제시” 로 생각해주세요.
☑️ 주어진 데이터를 활용하여 EDA 를 진행하여 아래 항목에 대한 확인이 가능하면 더더욱 좋겠죠?
- 서비스의 현 상태 확인
- 이슈사항 확인
- 고객 세그먼트화(특정 기준에 따라 유저를 나눔)
- 사용자의 연령과 성별, 고객 행동 패턴에 따라 코호트를 나누어 분석하면 다양한 인사이트가 나올 수 있어요!
- 변수 간의 상관관계 확인, Heatmap 등으로 시각화, 분포 확인 등을 진행해볼 수 있어요.
- 다양한 지표를 설계할 수 있어요.
- Action Item 등의 인사이트 제공
사용한 데이터셋
https://www.kaggle.com/datasets/meeraajayakumar/spotify-user-behavior-dataset?resource=download
Age
|
사용자의 연령층?
|
Gender
|
사용자의 성별은?
|
spotify_usage_period
|
spotify_usage_기간 - Spotify를 사용한 지 얼마나 되었나요?
|
spotify_listening_device
|
spotify_listening_device - 다음 중 Spotify를 청취할 때 주로 사용하는 장치는 무엇입니까?
|
spotify_subscription_plan
|
spotify_subscription_plan - 현재 어떤 Spotify 구독 계획을 갖고 계시나요?
|
premium_sub_willingness
|
premium_sub_willingness - 프리미엄 구독을 하시겠습니까, 아니면 앞으로도 프리미엄 구독을 계속할 의향이 있습니까?
|
preffered_premium_plan
|
prefered_premium_plan - 프리미엄이거나 프리미엄을 받을 의향이 있는 경우 구독료로 얼마를 지불합니까?
|
preferred_listening_content
|
preferred_listening_content - 무엇을 더 듣고 싶나요?
|
fav_music_genre
|
fav_music_genre - 어떤 장르의 음악을 가장 좋아하시나요?
|
music_time_slot
|
music_time_slot - 가장 좋아하는 음악 감상 시간은 언제인가요?
|
music_Influencial_mood
|
music_Influencial_mood - 음악을 들을 때 다음 중 어떤 기분이나 상황이 음악 선택에 가장 큰 영향을 미치나요?
|
music_lis_frequency
|
music_lis_주파수 - 언제 음악을 더 자주 듣나요?
|
music_expl_method
|
music_expl_method - Spotify에서 새로운 음악을 어떻게 발견하나요?
|
music_recc_rating
|
music_recc_ating - Spotify 음악 추천을 어떻게 평가하시나요?
|
pod_lis_frequency
|
pod_lis_주파수 - 팟캐스트를 얼마나 자주 듣나요?
|
fav_pod_genre
|
fav_pod_genre - 팟캐스트 중 어떤 장르를 가장 좋아하시나요?
|
preffered_pod_format
|
prefered_pod_format - 일반적으로 선호하는 팟캐스트 형식은 무엇입니까?
|
pod_host_preference
|
pod_host_preference - 알려지지 않은 인물의 팟캐스트를 듣는 것을 더 선호합니까, 아니면 유명인이 호스팅하는 팟캐스트를 선호합니까?
|
preffered_pod_duration
|
prefered_pod_duration - 짧은 팟캐스트 에피소드(30분 미만) 또는 긴 에피소드(30분 이상)를 선호합니까?
|
pod_variety_satisfaction
|
pod_variety_satisfaction - Spotify의 팟캐스트의 다양성과 가용성에 만족하시나요?
|
데이터가 어떤 식으로 구성되어 있는지 이 다음에 살펴봐야겠다.
'개인 프로젝트' 카테고리의 다른 글
2) 데이터 확인 (1) (0) | 2024.08.05 |
---|