일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- f-string
- python
- 선형회귀
- 프로그래머스
- AB테스트
- DATE_SUB
- Leetcode
- 반복문
- 통계학
- Til
- 다중공선성
- 시각화
- 내일배움일지
- SQL
- Set
- 데이터전처리
- 한줄for문
- 이중for문
- Join
- 내배캠_학습기록
- SQLD
- map
- 내일배움캠프
- 리스트
- ★
- 아티클스터디
- Max
- 태블로
- 데이터시각화
- 가설검정
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
오늘 목표1. 이력서 세군데 검토해서 내기 2. 경력기술서 수정해보기 3. 데이터 하나 다시 골라서 분석 진행해보기 -> 이상탐지 데이터셋을 찾아봤는데 아직 마땅한 걸 발견하진 못했다.이상탐지 공부하기강의 내용https://young-1-2.tistory.com/230 태그 : Til, 내배캠_학습기록, 내일배움캠프
https://www.youtube.com/watch?v=-h9yK4FUykc 이상탐지란?대다수의 데이터와 다른 거동을 갖는 unusual한 관찰을 탐지, 식별하는 것.정상 샘플들과 비정상 샘플들을 구별해내는 것. Anomaly DetectionOutlier DetectionNovelty DetectionFault Detection등 다양한 방식으로 불림 라벨링된 데이터 / 언라벨드 데이터 데이터의 종류에 따라 다른 접근방식을 가지고 있다.지도학습을 활용함 -> 라벨링 값으로 판단비지도학습 -> 정상 상태를 알 수 없고 학습을 통해 일부가 anomaly일 거라고 가정을 하고 접근 보통 두 데이터 형식이 섞여있는 semi-supervised 데이터도 존재함 라벨링된 데이터정상 데이터와 비정상 데이..
데이터 구성customers= pd.read_csv('dataset/customers.csv')orders= pd.read_csv('dataset/orders.csv')order_items= pd.read_csv('dataset/order_items.csv')payments= pd.read_csv('dataset/payments.csv')products= pd.read_csv('dataset/products.csv') 사용할 수 있는 데이터셋은 크게 다섯가지이다.각 데이터셋의 컬럼 설명은 이하와 같다.더보기ordersorder_id: 주문 IDcustomer_id: 고객 IDorder_status: 주문 상태order_purchase_timestamp: 주문 구매 시간order_approved_at: 주..