일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- map
- Til
- 통계학
- SQLD
- 선형회귀
- 한줄for문
- Join
- DATE_SUB
- SQL
- 시각화
- Leetcode
- 내일배움일지
- 태블로
- Max
- 다중공선성
- 리스트
- 프로그래머스
- 가설검정
- python
- 내배캠_학습기록
- 데이터전처리
- 반복문
- 이중for문
- Set
- 내일배움캠프
- 데이터시각화
- ★
- f-string
- 아티클스터디
- AB테스트
- Today
- Total
목록전체 글 (227)
노력에는 지름길이 없으니까요
☑️ 다항회귀독립 변수와 종속 변수 간의 관계가 선형이 아닐 때 사용. 독립 변수의 다항식을 사용하여 종속 변수를 예측.데이터가 곡선적 경향을 따를 때 사용합니다.비선형 관계를 모델링할 수 있습니다.고차 다항식의 경우 과적합(overfitting) 위험이 있습니다. ☑️ 스플라인 회귀독립 변수의 구간별로 다른 회귀식을 적용하여 복잡한 관계를 모델링구간마다 다른 다항식을 사용하여 전체적으로 매끄러운 곡선을 생성합니다.데이터가 국부적으로 다른 패턴을 보일 때 사용합니다.복잡한 비선형 관계를 유연하게 모델링할 수 있습니다.적절한 매듭점(knots)의 선택이 중요합니다. ☑️ 독립변수와 종속변수의 관계가 비선형 관계일 때 사용주택 가격 예측(면적과 가격 간의 비선형 관계) from sklearn.prepro..
회귀에서 범주형 변수의 경우 특별히 변환을 해주어야 함! ☑️ 범주형 변수수치형 데이터가 아닌 주로 문자형 데이터로 이루어져 있지 않는 변수가 범주형 변수 ☑️ 범주형 변수 종류예를 들어 성별(남, 여), 지역(도시, 시골) 등이 있으며, 더미 변수로 변환하여 회귀 분석에 사용.순서가 있는 범주형 변수옷의 사이즈 (L, M, …), 수능 등급 (1등급, 2등급, ….)과 같이 범주형 변수라도 순서가 있는 변수에 해당한다이런 경우 각 문자를 임의의 숫자로 변환해도 문제가 없다 (순서가 잘 반영될 수 있게 숫자로 변환)ex) XL → 3, L → 2, M → 1, S → 0순서가 없는 범주형 변수성별 (남,여), 지역 (부산, 대구, 대전, …) 과 같이 순서가 없는 변수에 해당한다2개 밖에 없는 경우 임의..
두개 이상의 변수에 의한 결과를 예측일반적으로 많이 사용되는 선형회귀가 이쪽에 가까움 다중선형회귀두 개 이상의 독립 변수(X1, X2, ..., Xn)와 하나의 종속 변수(Y) 간의 관계를 모델링.공간적으로 확장이 됨! -> 직선보다 평면으로 생각 ☑️ 회귀식Y = β0 + β1X1 + β2X2 + ... + βnXn☑️ 특징여러 독립 변수의 변화를 고려하여 종속 변수를 설명하고 예측종속변수에 영향을 미치는 여러 독립변수가 있을 때 사용합니다.여러 변수의 영향을 동시에 분석할 수 있습니다.변수들 간의 다중공선성 문제가 발생할 수 있습니다. https://young-1-2.tistory.com/162 다중공선성이란?다중공선성이란?다중공선성(Multicollinearity)은 회귀분석에서 독립 변수들 간에..