250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 프로그래머스
- Max
- AB테스트
- f-string
- Leetcode
- DATE_SUB
- 선형회귀
- 내일배움캠프
- 가설검정
- 다중공선성
- 이중for문
- 통계학
- SQLD
- Set
- Join
- 데이터시각화
- ★
- 리스트
- 아티클스터디
- 한줄for문
- python
- 내일배움일지
- 태블로
- SQL
- 내배캠_학습기록
- 시각화
- Til
- map
- 데이터전처리
- 반복문
Archives
- Today
- Total
목록2024/09/12 (1)
노력에는 지름길이 없으니까요
240911 - 심화 프로젝트 경과
df->df4로 데이터셋 나누는 과정에서 중복 데이터가 발생한 듯 하여 중복 제거한 데이터프레임도 참고해가며 보았습니다. 결과요점부터 말하자면, 제품군 자체가 크진 않습니다.카테고리는 전부 운동용품 관련으로 치우쳐져 있으며, 운동과 관련없는 컬럼이 존재하나 df 기준 레코드 수는 7602개. 11만개에 비하면 작고... 아예 운동용품으로 데이터를 한정시켜도 괜찮지 않을까 생각합니다.또한 운동용품이 아닌 카테고리 중에는 오분류된 데이터도 꽤 존재했습니다. electronics지만 골프공, 신발에 해당하는 경우가 있었어요.카테고리수에 비해 프로덕트 수가 적어서 살펴보았더니, 하나의 카테고리에 하나의 상품만 존재하는 경우가 다수 존재합니다.Category Name 유니크값 50, Product Name 유니..
카테고리 없음
2024. 9. 12. 23:50