라쏘 회귀 개념과 예시로 배우는 머신러닝 핵심 이론 | LASSO Regression
라쏘 회귀(LASSO Regression) 개념과 예시로 배우는 머신러닝 핵심 이론 라쏘 회귀는 머신러닝에서 중요한 정규화 기법 중 하나로, 변수 선택과 모델 단순화를 동시에 실현하는 고급 회귀 분석 방법입니다. 이 글에서는 라쏘 회귀의 정의부터 수식, 다른 회귀 기법과의 차이점, 실제 활용 예시, 장단점, 그리고 자주 묻는 질문까지 폭넓게 설명합니다. 추가적인 회귀분석기법 알아보기 > 1. 라쏘 회귀란? - 정의와 작동 원리 라쏘 회귀(LASSO: Least Absolute Shrinkage and Selection Operator)는 선형 회귀(linear regression) 모델에 L1 정규화 항을 추가하여 계수 축소(coefficient shrinkage)와 변수 선택(feature selection)을 동시에 수행하는 머신러닝 기법입니다. 기본적인 아이디어는 덜 중요한 변수의 계수를 0으로 만들어 모델을 단순화하고 해석력을 높이는 데 있습니다. 라쏘 회귀의 목적 함수는 다음과 같습니다: min β [ Σ n i=1 (y i - ŷ i ) 2 + λ Σ p j=1 |β j | ] 여기서 ŷ i = β 0 + β 1 x i1 + … + β p x ip 여기서: y i : i번째 실제 종속변수 값 (관측된 결과) ŷ i : i번째 예측값, 모델이 추정한 값 n : 데이터 샘플 개수 (관측치 수) p : 독립변수(특징, feature)의 개수 β 0 : 절편(intercept), 회귀선의 시작점 β j : j번째 독립변수의 회귀계수 (가중치) x ij : i번째 샘플의 j번째 독립변수 값 λ : 규제 강도(regularization parameter), 벌칙항의 크기를 조절하는 하이퍼파라미터 Σ(y i - ŷ i )² : 잔차 제곱합(오차항), 모델의 적합도 측정 Σ|β j | : L1 규제항, 계수들의 ...