DB/ML4 [머신러닝] 로지스틱 회귀 (Logistic Regression) 로지스틱 회귀 (Logistic Regression) 선형 회귀 분류는 예외적인 데이터에 예민한 단점이 있다. 그래서 분류를 할 때는 로지스틱 회귀 (Logistic Regression) 를 사용한다. 로지스틱 회귀는 데이터에 가장 잘 맞는 시그모이드 함수를 찾는 것이다. 시그모이드 함수는 곡선의 형태이며 항상 0과 1의 사이의 결과를 낸다. ? 로지스틱 회귀는 분류를 하기 위해 쓰인다는데 왜 '회귀'인가 : 사실 시그모이드 함수의 결괏값도 결국은 0과 1 사이의 연속적인 값이기 때문에 회귀라고 볼 수 있다. 그래서 '로지스틱 분류'가 아닌 '로지스틱 회귀'라고 부른다. 우리는 주로 시그모이드 함수를 결괏값이 0.5보다 큰지 작은지 보고 결국 분류를 하기에 명칭은 '회귀'이지만 주로 사용하는 건 분류라는.. DB/ML 2023. 12. 21. [머신러닝] 범죄율(CRIM)로 집값 예측하기 [ 범죄율로 집 값 예측하기 ] scikit-learn을 사용하여 선형 회귀를 직접 연습하기. CRIM : 동네의 범죄율 범죄율 열을 선택 training-test set 나누기 모델을 학습 test 데이터로 예측 - 입력 변수로는 범죄율 열만 이용. - train_test_split 함수의 옵셔널 파라미터는 test_size = 0.2, random_state = 5 - 예측 값 벡터 변수 이름은 y_test_predict # 필요한 라이브러리 import from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression .. DB/ML 2023. 12. 20. [머신러닝] 선형 회귀(Linear Regression) 머신러닝 알고리즘 선형 회귀에 대해 정리해 보자 ! 선형 회귀는 단순하면서도 유용하고, 특히 다른 많은 알고리즘의 기반이 되기 때문에 완벽하게 이해하는 것이 중요하기에 관련된 개념들도 함께 정리해 보자. 선형 회귀 (Linear Regression) : 알려진 다른 관련 데이터 값을 사용하여 알 수 없는 데이터의 값을 예측하는 데이터 분석 기법. : 선형회귀는 머신러닝에서 '지도 학습(회귀/분류) 알고리즘' 중 연속적인 값을 예측하는 회귀에 해당한다. - 목표 변수 (target variable / output variable) : 맞추려고 하는 값 - 입력 변수 (input variable / feature) : 맞추는 데 사용하는 값 , '특징/속성' 쉽게 말하자면 위 그래프에서 데이터를 가장 잘 대.. DB/ML 2023. 12. 20. Kaggle(캐글) 타이타닉 생존자 예측하기 (1) [ Kaggle(캐글) 타이타닉 문제 해결하기] Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 타이타닉 탑승자 정보 데이터를 가지고, "어떤 종류의 사람이 생존할 가능성이 높은가?" 라는 질문에 답하는 예측 모델을 구축해 봅시다! 필자는 Google colab에서 실행하였다. 따라서 Data에서 훈련세트, 테스트세트 Dataset을 받아서 해당파일 경로에 넣어주었다. [ 훈련세트 필드명 확인 ] survived : 생존=1, 죽음=0 pclass : 승객 등급. 1등급=1, 2등급=2, 3등급=3 sibsp : 함께 탑승한 형제 또는 배우자 수 parch : 함께 탑승한 부모 또는 자녀 수 ticket : 티켓 번호 cabin : 선실.. DB/ML 2023. 12. 19. 이전 1 다음 728x90