일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- SQLD
- 프로그래머스
- 내일배움일지
- 내배캠_학습기록
- python
- 데이터전처리
- AB테스트
- 태블로
- 내일배움캠프
- map
- 반복문
- 선형회귀
- Join
- 아티클스터디
- 다중공선성
- Max
- 통계학
- 데이터시각화
- SQL
- 가설검정
- Leetcode
- 리스트
- DATE_SUB
- 이중for문
- f-string
- 한줄for문
- Set
- 시각화
- Til
- ★
- Today
- Total
목록분류 전체보기 (227)
노력에는 지름길이 없으니까요
한개의 변수에 의한 결과를 예측금융관련, 매출 예측 등... 다양하게 쓰이는 방법 왜 경향성 파악하는 방법론의 용어로 '회귀'라는 단어를 쓰는가?사람의 키가 세대가 지남에 따라 어느 정도가 차이가 있겠으나, 결국 평균으로 돌아오려 한다, 즉 평균으로 회귀한다는 연구 결과를 얻어내고 이 이후로 경향성 문제에서 '회귀'라는 표현을 쓰기 시작했다고 함! 선형회귀란?직선 형태로 회귀를 하는구나! 직선과 같은 관계를 보일 때! 회귀를 통해 우리가 가지고 있지 않은 데이터에 대해서도 예측할 수 있게 된다.\단순선형회귀- 하나의 독립 변수(X)와 하나의 종속 변수(Y) 간의 관계를 직선으로 모델링하는 방법. ☑️ 회귀식Y = β0 + β1X, 여기서 β0는 절편, β1는 기울기중학교 때 배웠던 1차함수를 생각하면 이..
오늘 목표코드카타 1개 이상통계학 기초 3주차통계학 복습 완벽하게 하기 강의 내용코드카타SQL, level 2 https://young-1-2.tistory.com/154 통계학대표 1) https://young-1-2.tistory.com/155
두개를 구분하고 최대한 줄일 수 있도록 해야 함!!! 1) 제 1종 오류와 제 2종 오류는 무엇일까?☑️ 제 1종 오류귀무가설이 참인데 기각하는 오류잘못된 긍정을 의미 (아무런 영향이 없는데 영향이 있다고 하는 것)한 단어로 위양성!α를 경계로 귀무가설을 기각하기 때문에 제1종 오류가 α만큼 발생따라서 유의수준(α)을 정함으로써 제 1종 오류 제어 가능만약, 유의수준이 0.05라면 100번 중 5번 정도 일어날 수 있는 제 1종 오류는 감수하겠다는 것 ❓다중 검정시 제 1종 오류가 증가하는 이유? -> 보정을 해야하는 이유!하나의 검정에서 제1종 오류가 발생하지 않을 확률은 1- α 입니다.m개의 독립된 검정에서 제1종 오류가 전혀 발생하지 않을 확률은 (1- α)^m입니다.따라서, m개의 검정에서 하나..
카이제곱검정범주형 데이터의 분석에 사용한다!!! - 범주형 데이터의 표본 분포가 모집단 분포와 일치하는지 검정(적합도 검정)하거나 - 두 범주형 변수 간의 독립성을 검정(독립성 검정) 적합도, 독립성 검정에 따라 사용하는 함수가 다르다!☑️ 적합도 검정 -> stats.chisquare관찰된 분포와 기대된 분포가 일치하는지 검정p값이 높으면 데이터가 귀무 가설에 잘 맞음. 즉, 관찰된 데이터와 귀무 가설이 적합p값이 낮으면 데이터가 귀무 가설에 잘 맞지 않음. 즉, 관찰된 데이터와 귀무 가설이 부적합 stats.chisquare카이제곱 적합도 검정을 수행하여 관찰된 빈도 분포가 기대된 빈도 분포와 일치하는지 평가 ☑️ 독립성 검정 -> stats.chi2_contingency두 범주형 변수 간의 독립성을..
☑️ 다중검정여러 가설을 동시에 검정할 때 발생하는 문제각 검정마다 유의수준을 조정하지 않으면 1종 오류(귀무가설이 참인데 기각하는 오류) 발생 확률이 증가1종 오류가 무엇인지랑 왜 다중검정시 발생확률이 증가하는지는 밑에서 다시 설명! 지금은, 어떤 오류가 발생할 수 있다는 정도로 이해! ☑️ 보정 방법본페로니 보정, 튜키 보정, 던넷 보정, 윌리엄스 보정 등이 있음가장 대표적이고 기본적인게 본페로니 보정 import numpy as npimport scipy.stats as stats# 세 그룹의 데이터 생성np.random.seed(42)group_A = np.random.normal(10, 2, 30)group_B = np.random.normal(12, 2, 30)group_C = np.rand..
이 데이터가 의미가 있다고 볼 수 있는지, ... 가설을 세워서 그걸 검정해보는 것... 문제 발생 -> 가설을 세움 -> 귀무가설, 대립가설로 분류하고 둘 중 하나를 선택해야 한다. (정반대 중 하나!) -> 선택해서 결론을 내리는 것임☑️ 가설검정표본 데이터를 통해 모집단의 가설을 검증하는 과정즉, 데이터가 특정 가설을 지지하는지 평가하는 과정귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정 데이터 분석시 두가지 전략을 취할 수 있음확증적 자료분석미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석탐색적 자료분석(EDA)가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것 ☑️ 단계귀무가설(H0)과 대립가설(H1) 설정유의수준(α) 결..
유의성 검정이란?통계를 배우며 많이 쓰여질 부분.유사한가 아닌가에 대한 판단. 대표적으로... 두가지 서비스를 준비했을 때 기존 서비스보다 새로운 서비스가 더 효과가 있는가에 대한 테스트... 실무에서 자주 사용될 수 있음. 1) A/B 검정A/B 검정은 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법.표본에 대한 데이터 값... 일부 사용자들에게 얻은 값이 모집단에게도 동일한 값을 가질 것인가? 가 중요함마케팅, 웹사이트 디자인 등에서 많이 사용됨.사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교.일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 비교.목적두 그룹 간의 변화가 ..
해결일언어레벨 테스트명 20240802SQLlevel 2 조건에 맞는 개발자 찾기 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/276034 문제 요약 : 특정 기술을 갖고 있는 사람 찾아내기문제의 요점은 스킬코드가 다 2진수로 되어 있는 점에 있다. 내 코드SELECT ID, EMAIL, FIRST_NAME, LAST_NAMEFROM DEVELOPERSWHERE SKILL_CODE & (SELECT CODE FROM SKILLCODES WHERE NAME = 'Python')OR SKILL_CODE & (SELECT CODE FROM SKILLCODES WHERE NAME = 'C#'..
오늘 목표통계학 1주차통계학 2주차통계학 복습 완벽하게 하기코드카타 1개 이상프로젝트 코드 정리 이어서 -> 진행중강의 내용코드카타Python, level 0 https://young-1-2.tistory.com/141SQL, level 3 https://young-1-2.tistory.com/140 통계학 공부1 대표 ) https://young-1-2.tistory.com/1442 대표 ) https://young-1-2.tistory.com/145