DB/ML

[머신러닝] 로지스틱 회귀 (Logistic Regression)

콩다영 2023. 12. 21.
728x90

로지스틱 회귀 (Logistic Regression) 

 

 

선형 회귀 분류는 예외적인 데이터에 예민한 단점이 있다.

그래서 분류를 할 때는 로지스틱 회귀 (Logistic Regression) 를 사용한다.

 

 

로지스틱 회귀는 데이터에 가장 잘 맞는 시그모이드 함수를 찾는 것이다.

시그모이드 함수는 곡선의 형태이며 항상 0과 1의 사이의 결과를 낸다.

 

시그모이드 함수의 식
시그모이드 함수 그래프 (곡선)

 

 

? 로지스틱 회귀는 분류를 하기 위해 쓰인다는데 왜 '회귀'인가

: 사실 시그모이드 함수의 결괏값도 결국은 0과 1 사이의 연속적인 값이기 때문에 회귀라고 볼 수 있다.

그래서 '로지스틱 분류'가 아닌 '로지스틱 회귀'라고 부른다. 우리는 주로 시그모이드 함수를 결괏값이 0.5보다 큰지 작은지 보고

결국 분류를 하기에 명칭은 '회귀'이지만 주로 사용하는 건 분류라는 점을 유의하여 사용하면 좋을 것 같다 ! 

 

 

 

로지스틱 회귀 손실함수 = 로그 손실 (log-loss / cross entropy)

손실의 정도를 로그 함수로 결정하기 때문에 로그 손실 !

 

→ 모든 데이터의 로그 손실을 계산한 후, 평균을 낸다.

 

 

로지스틱 회귀의 가설함수와 그 외 수식들은 선형 회귀와 같은 루틴으로 정리는 생략한다.

알고리즘별 주요 특징을 확실히 익혀서 머신러닝 알고리즘을 선택할 때 적절한 알고리즘을 선택하는 것이

결과 예측에 큰 도움을 줄 것이다. 알고리즘별 주요 특징을 잘 파악하고 있자 !!   :D

 

 

 

728x90
반응형

댓글