일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 내일배움캠프
- 반복문
- 데이터시각화
- 내일배움일지
- 데이터전처리
- 리스트
- python
- 이중for문
- AB테스트
- SQLD
- Leetcode
- 통계학
- 다중공선성
- SQL
- map
- Set
- Max
- 선형회귀
- 한줄for문
- 시각화
- DATE_SUB
- ★
- Til
- 아티클스터디
- 프로그래머스
- 태블로
- Join
- f-string
- 내배캠_학습기록
- 가설검정
- Today
- Total
목록분류 전체보기 (227)
노력에는 지름길이 없으니까요
Pandas를 활용하면대용량 데이터 처리가 가능 : Pandas는 데이터를 메모리에 로드하고, 다양한 연산을 빠른 처리가 가능하며 대용량 데이터를 처리하는데 최적화되어 있습니다.데이터 조작 기능 : 데이터 정렬, 필터링, 집계, 결측값 처리 등 데이터를 쉽게 가공할 수 있음데이터 시각화 기능 제공 : Matplotlib, Seaborn , … , etc데이터를 구조화하여 분석할 수 있음 : DataFrame이라는 자료형을 제공하여 데이터를 표 형태로 나타내어 분석이 가능함 시리즈와 데이터프레임의 차이데이터프레임에 있는 하나의 컬럼이 시리즈라고 생각하면 됨!데이터프레임음 컬럼이 두 개 이상인 표. 데이터 불러오기, 저장하기인덱스 : 데이터프레임(DataFrame) 또는 시리즈(Series)의 각 행 또..
해결일언어레벨 테스트명 20240717Pythonlevel 1 콜라 문제 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/132267# 내 코드def solution(a, b, n): total, rest = 0, 0 while n>a: if n%a != 0 : rest = n%a total += (n//a)*b n = (n//a)*b + n%a return total + (n//a)*b 개선점: 문제를 훨씬 더 복잡하게 푼 것 같은데 ㅋㅋㅋㅋㅋ 베스트 코드def solution(a, b, n): answer = 0 while n >= a: n -= a ..
데이터 분석가 유형내가 원하는 데이터 분석가 유형 고르기비즈니스 분석가주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석합니다.비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원합니다.주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행합니다.프로덕트 분석가제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석합니다.사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여합니다.주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당합니다.데이터 분석가주로 정형 데이터를 분석하여 기업의 의사 결정을 지원합니다.데이터베이스, 스프레드시트 등에서 데이터를 추출하고, 데이터를 정제하여 보고서..
오늘 목표시각화 조사그래프 조사아티클 읽고 정리하기SQLD 2-2까지 듣기코드카타 2문제 이상 1데이터베이스 강의 16일 중 최고로 집중을 못 했다!!!! 뭐 이런 날도 있는 거지오늘은 빨리 접고 산책하고 책 읽으면서 내일을 위해 쉬는 걸로...강의 내용코드카타level 0, Python https://young-1-2.tistory.com/105level 4, SQL https://young-1-2.tistory.com/107 아티클 정리https://young-1-2.tistory.com/106 SQLDhttps://young-1-2.tistory.com/108
데이터(Data)란?데이터(Data)데이터는 ‘정보(information)’단, 저장이나 처리에 효율적인 형태로 변환된 정보데이터의 시대매일 초당 2억개의 메일이 전송되고, 3만명이상이 넷플릭스를 시청하며 2020년 기준 배달의 민족 월 평균 주문이 약 6천만건을 돌파전세계의 모든 데이터의 90%는 2015년 이후 생성된 것 (IBM)2025년 전세계 데이터 생성량은 175ZB에 이를 것(Seagate)1 Tera == 1000 Giga1 Peta == 1000 Tera1 Exa == 1000 Peta1 Zeta == 1000 Exa 😇 즉, 매순간 엄청난 데이터가 축적되고 있음무한하게 증가하는 이 데이터를 ‘잘’ 저장하고 관리하는 기술이 필요 👀데이터를 저장하고 관리하기 위해 만들어진 것이 데이터베..
해결일언어레벨 테스트명 20240716SQLlevel 4 우유와 요거트가 담긴 장바구니 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/62284 내 코드SELECT CART_IDFROM CART_PRODUCTSWHERE NAME ='Yogurt'INTERSECTSELECT CART_IDFROM CART_PRODUCTSWHERE NAME = 'Milk' 교집합을 구하면 될 것 같아서 조사를 해보니집합 관련 명령문이 있기에 정리해두었다. SQL 일반 집합 연산합집합 : UNIONSELECT * FROM (테이블1)UNIONSELECT * FROM (테이블2); 교집합 : INTERSECT-- 선택한 컬럼에 대해서만 교집합 연..
https://yozm.wishket.com/magazine/detail/1051/ 데이터 기반 의사결정의 장점 | 요즘IT데이터 기반 의사결정은 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동 방침을 승인하는 과정을 의미합니다. 데이터 기반의 의사결정은 분명 수많은yozm.wishket.com 모든 결정을 내릴 때 본능적인 직관력에 의존하는 것은 대단히 위험한 실수가 될 수 있다.우리는 주어진 정보를 꼼꼼히 따져보고 이해하고, 객관적으로 수량화해야 한다. 데이터 기반 의사결정이란?본격적으로 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동방침을 승인하는 과정. Date-Driven Decision-Making (DDDM)이라고 ..
해결일언어레벨 테스트명 20240716Pythonlevel 0 홀수 vs 짝수 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/181887 내 코드def solution(num_list): return max(sum(num_list[i] for i in range(1,len(num_list),2)),sum(num_list[i] for i in range(0,len(num_list),2))) 구구절절. 개선점: 요즘 계속 리스트 표현법을 망각하는 것 같다... 간단한 걸 얼마든지 쓸 수 있는데!!! 포스트잇이라도 붙여놔야 하나. 베스트 코드def solution(num_list): return max(sum(num_list[..
벌써 3주차 접어들었다. 화이팅! 오늘 목표코드카타 1개 제대로 (가능하면 2개)파이썬 과제 답안 확인데코레이션 조사시각화 조사 -> iplot이 생각보다 제대로 인스톨이 안돼서 애먹고 있다.그래프 조사 -> 상위 카테고리인 자료구조부터 조사하는 중SQL 챌린지 강의 듣기dictionary 조사강의 내용기술 조사데코레이션 https://young-1-2.tistory.com/98dictionary https://young-1-2.tistory.com/102(미완) 그래프 총정리 https://young-1-2.tistory.com/104 코트카타SQL, JOIN, level 4 https://young-1-2.tistory.com/101 SQL 강의데이터 분석가는 쿼리 머신이 아니다. 어떤 데이터베이스에..
무조건 리스트만 쓰는 습관을 고쳐버리고 싶어서...dictionary에 대해 완벽하게 조사를 하고 메소드도 정리해두겠다. 딕셔너리에서 자주 사용되는 메서드keys(): 모든 키를 dict_keys 객체로 반환values(): 모든 값을 dict_values 객체로 반환items(): 모든 키-값 쌍을 (키, 값) 튜플로 구성된 dict_items 객체로 반환get(): 지정된 키에 대한 값을 반환합니다. 키가 존재하지 않으면 기본값을 반환pop(): 지정된 키와 해당 값을 딕셔너리에서 제거하고 값을 반환popitem(): 딕셔너리에서 마지막 키-값 쌍을 제거하고 반환 딕셔너리 for문 사용법for k, v in test.items(): print(k) # key print(v) # value ..