차례:
비디오: [토크ON세미나] Scikit-Learn으로 다지는 머신러닝 기초 1강 - 데이터전처리 (Preprocessing) | T아카데미 2024
데이터의 분산 분석은 응답 변수를 모델링하기위한 예측 변수로 요인을 사용하는 R에서 선형 모델 로 작성할 수 있습니다. 물론 예측 변수는 연속 변수 일 수도 있습니다. 예를 들어, 자동차 중량이 마일리지에 영향을 미치는 것은 분명합니다. 그러나 그 영향의 크기에 대해 생각해 보는 것이 좋을 것입니다. 근본적으로 추세선을 나타내는 방정식을 찾고 싶습니다. mtcars 데이터 세트에서이를 확인하는 데 필요한 데이터를 찾습니다.
lm () 함수는 가장 단순한 선형 모델에서 복잡한 상호 작용 모델에 이르기까지 무엇이든 지정할 수있게합니다. >> 자동차 중량의 함수로 마일리지를 모델링하려면 다음과 같이 lm () 함수를 사용합니다. >> Model <- lm (mpg ~ wt, data = mtcars)
인수:
모델을 설명하는 수식:
변수 mpg를 변수 wt의 함수로 모델링합니다.
수식의 변수를 포함하는 데이터 프레임:
여기서 데이터 프레임 mtcars를 사용합니다.-
주위를 알고있을 때 수식 인터페이스로 여러 복잡한 모델을 지정할 수 있습니다. 결과 객체는 매우 복잡한 구조의 목록이지만 대부분의 경우 걱정할 필요가 없습니다. 모델 객체에는 진단 및 새로운 예측의 계산에 필요한 많은 정보가 포함되어 있습니다.
-
모델에서 정보를 추출하는 방법
모델 객체 자체를 다이빙하고 목록 객체의 어딘가에서 정보를 찾는 대신 필요한 정보를 얻는 데 도움이되는 몇 가지 함수를 사용할 수 있습니다 모델에서. 예를 들어, >> coef와 같이 coef () 함수를 사용하여 모델의 계수를 사용하여 명명 된 벡터를 추출 할 수 있습니다. 모델 계수 모델 (가로 채기) 무게 37. 285126 -5. 344472
이 계수는 추세선의 절편과 기울기를 나타냅니다. 이 값을 사용하여 데이터의 산점도에 추세선을 그릴 수 있습니다. 두 단계로이 작업을 수행합니다.
데이터로 산점도를 그립니다.당신은 그것을 위해 plot () 함수를 사용합니다.
abline () 함수를 사용하여 계수를 기반으로 추세선을 그립니다.
다음 코드는 플롯을 제공합니다: >> plot (mpg ~ wt, data = mtcars)> abline (a = coef.Model [1], b = coef.Model [2])
abline () 인수 a는 절편을 나타내며 b는 플롯 할 추세선의 기울기를 나타냅니다. 인수 v를
-
x
축을 가진 절편으로 설정하여 수직선을 그립니다.수평선은 인수 v를
-
y
축을 가진 절편으로 설정하여 플롯됩니다.
아래는 모델 객체 자체에서 정보를 추출하는 함수의 개요이다. 이러한 함수는 aov () 및 lm ()에 의해 빌드 된 모델 오브젝트를 포함하여 다른 모델 오브젝트와 함께 작동합니다.
많은 패키지 작성자는 패키지의 함수로 빌드 된 모델에 대해 동일한 기능을 제공합니다. 따라서 이러한 추출 기능을 다른 모델 기능과 함께 사용하려고 항상 노력할 수 있습니다. 함수 coef coef () 모델의 계수가있는 벡터를 반환합니다.
confint ()
의 상한과 하한이있는 행렬을 반환합니다. > 모델의 각 계수에 대한 신뢰 구간 | fitted () |
---|---|
모든 | 관측치 |
residuals ()에 맞는 값을 갖는 벡터를 반환 | 모든 관측치에 대해 잔차가있는 벡터를 반환 < vcov ()
계수에 대한 분산 - 공분산 행렬을 반환합니다. |