반응형
Ridge 회귀 (L2 규제)
- 선형 모델이며 최소적합법을 사용
- 일반 회귀와 다른 점은 가중치(w 또는 β) 의 절대값을 최대한 작게 함
- 즉 기울기를 0으로 만듬
- 이렇게 하는 이유는 과대적합이 생기지 않도록 모델을 강제로 제한함을 의미
Lasso 회귀 (L1 규제)
- Ridge에서와 마찬가지로 계수를 0에 가깝게 제한하는 것은 동일함
- 하지만 정말로 0인 계수가 생기기도 함. 즉 제외되는 계수도 발생
- 이는 자동으로 특성이 선택된다고 볼 수 있으며 가장 중요한 특성이 무엇인지 드러내 준다고 생각하면 됨
- 간혹 Lasso를 이용하면 과속적합이 발생하기도 하는데, 이는 너무 많은 Feature를 Drop하여 모델을 못 쓰게 만드는 경우이다.
무엇을 사용할 것인가?
- 일반적으로 Ridge 회귀를 분석에서 선호하는 편
- 다만 분석하기 쉬운 모델을 고를 경우 Lasso가 더 좋은 선택이 될 수 있음
- Lasso와 Ridge의 패널티를 결합한 ElasticNet이라는 것도 있음. 최상의 결과를 내기도 하지만 두 개의 매개변수를 조정해야 함.
참고 사이트
반응형
'Data > Machine Learning' 카테고리의 다른 글
PCA(주성분 분석), 고유값, 고유벡터 정리 (0) | 2022.04.12 |
---|---|
차원축소(Dimension Reduction) 정리 (0) | 2022.04.12 |
Decision Tree Regression (0) | 2019.12.27 |
파이썬 사이킷런에서 model에서 fit and fit_transform의 차이 (0) | 2019.09.28 |
6. Machine Learning - Polynomial Regression(다항식 회귀) 인트로 (0) | 2019.09.28 |