일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 리스트
- 이중for문
- 가설검정
- 데이터시각화
- DATE_SUB
- 다중공선성
- ★
- Max
- 반복문
- Til
- 통계학
- f-string
- 한줄for문
- 선형회귀
- 내일배움일지
- Leetcode
- SQLD
- 프로그래머스
- 데이터전처리
- 시각화
- AB테스트
- SQL
- python
- 아티클스터디
- 태블로
- Set
- Join
- map
- 내일배움캠프
- 내배캠_학습기록
- Today
- Total
목록분류 전체보기 (227)
노력에는 지름길이 없으니까요
오늘 목표시계열 머신러닝 강의 1회차 듣고 요약 정리시계열 머신러닝 과제인적성 준비 으아... 서류 합격했다인적성 힘내자...강의 내용 시계열 머신러닝 강의https://young-1-2.tistory.com/manage/posts/ https://young-1-2.tistory.com/233
데이터 추출: 데이터를 효율적으로 추출하고 가공하는 방법 SQL, Python(Pandas)데이터 시각화: 효과적인 데이터 정보 획득을 도와주는 방법 Tabelau, PowerBI, Looker Studio, Excel기초 통계 분석: 데이터의 기본적인 특성을 이해하는 방법 기술통계: 평균, 표준편차, 백분율 가설검정: t-test, chi-square, ANOVA 고급 통계 분석: 복잡한 관계를 탐색하고 모델링하는 방법 인과추론: RCT(A/B test), 선형회귀, 매칭 시계열 분석: ARIMA 생존분석: Cox Regression 다변량분석: PCA, Factor Analysis 연관분석: 장바구니 분석, Apriori 알고리즘머신러닝: 데이터를 통해 패턴을 학습하고 예측하는 방법 지도학습(회귀, ..
머신러닝시계열 자체가 어려움 시계열 : 시계열로 적용한 프로젝트 Needs 발견MLops : 머신러닝, operation의 축약어로 Jupyternotebook에만 코딩하고 끝나는 것이 아닌 실제로 사내 operation 시스템에 적용하는 것을 목표 시계열 분석이란? 과거의 흐름으로 미래를 예측하는 방법론 어떤 교과과정 어디에 속해 있는가?통계학, 데이터 사이언스의 전공과목에서도 4학년 전공 선택으로 난이도가 높은 과목선형대수학 - 수리통계 과거의 트랜드로 미래를 예측할 수 있다는 매력적인 논리로 많은 회사들이 시계열 모델을 적용하고 있으며 Meta는 Prophet모델, 딥러닝에서는 LSTM, RNN, Transfomer등 다양한 시계열 모델들이 개발되었음 튜터님께서 추천해주신 링크들더보기확률&통계..
오늘 목표1. 이력서 세군데 검토해서 내기 2. 경력기술서 수정해보기 3. 데이터 하나 다시 골라서 분석 진행해보기 -> 이상탐지 데이터셋을 찾아봤는데 아직 마땅한 걸 발견하진 못했다.이상탐지 공부하기강의 내용https://young-1-2.tistory.com/230 태그 : Til, 내배캠_학습기록, 내일배움캠프
https://www.youtube.com/watch?v=-h9yK4FUykc 이상탐지란?대다수의 데이터와 다른 거동을 갖는 unusual한 관찰을 탐지, 식별하는 것.정상 샘플들과 비정상 샘플들을 구별해내는 것. Anomaly DetectionOutlier DetectionNovelty DetectionFault Detection등 다양한 방식으로 불림 라벨링된 데이터 / 언라벨드 데이터 데이터의 종류에 따라 다른 접근방식을 가지고 있다.지도학습을 활용함 -> 라벨링 값으로 판단비지도학습 -> 정상 상태를 알 수 없고 학습을 통해 일부가 anomaly일 거라고 가정을 하고 접근 보통 두 데이터 형식이 섞여있는 semi-supervised 데이터도 존재함 라벨링된 데이터정상 데이터와 비정상 데이..
데이터 구성customers= pd.read_csv('dataset/customers.csv')orders= pd.read_csv('dataset/orders.csv')order_items= pd.read_csv('dataset/order_items.csv')payments= pd.read_csv('dataset/payments.csv')products= pd.read_csv('dataset/products.csv') 사용할 수 있는 데이터셋은 크게 다섯가지이다.각 데이터셋의 컬럼 설명은 이하와 같다.더보기ordersorder_id: 주문 IDcustomer_id: 고객 IDorder_status: 주문 상태order_purchase_timestamp: 주문 구매 시간order_approved_at: 주..
우리가 놓치고 있는 중요한 고객의 패턴 확인 혹은 새로운 기준에 따라 유저 그룹화 특정 기준에 따라 군집화. 군집별 인사이트 도출 -> 서비스 반영에 대한 방향성 제시 주제- 데이터셋 현황 파악 - 다양한 조건(군집갯수, 컬럼갯수)을 통해 결과를 비교 - 군집(클러스터)별로 유의미한 특징을 살펴보고 이를 시각화 - 군집별 인사이트를 제시 설명- 각 테이블을 결합하여, 클러스터링을 위한 하나의 데이터셋으로 - 이상치 처리 기법을 활용하거나, 특정 기준을 세워 이상치를 정의 하고 그 이유를 설명 - 클러스터링시, 초기 군집의 갯수와 사용할 컬럼의 갯수는 python 머신러닝 라이브러리를 활용 - 컬럼별 raw data 분포 시각화 - 컬럼 간 상관계수를 히트맵 차트로 구현해주세요. (유의미한 기..
해결일언어레벨테스트명20240916Pythoneasy1837. Sum of Digits in Base K 링크 : https://leetcode.com/problems/sum-of-digits-in-base-k/ n진수로 바꾸는 법. 내 코드class Solution: def sumBase(self, n: int, k: int) -> int: answer = '' while n : answer += str(n%k) n //= k return sum(int(i) for i in answer[::-1])
해결일언어레벨테스트명20240916Pythoneasy 1748. Sum of Unique Elements 링크 : https://leetcode.com/problems/sum-of-unique-elements/ 내 코드class Solution: def sumOfUnique(self, nums: List[int]) -> int: return sum([num for num in nums if nums.count(num) == 1]) 리스트에서 특정 문자 개수 찾기는 count
해결일언어레벨테스트명20240913Pythoneasy 1967. Number of Strings That Appear as Substrings in Word 링크 : https://leetcode.com/problems/number-of-strings-that-appear-as-substrings-in-word/ 내 코드class Solution: def numOfStrings(self, patterns: List[str], word: str) -> int: ans = 0 for pattern in patterns : if pattern in word: ans += 1 return ans 문자열이 부분일치하는..