비디오: 직접 코딩해보는 머신러닝 in R - 02강 다중 회귀분석 2024
새로운 데이터를 사용하여 분석 예측을 수행하려면 다음을 수행하십시오., 당신은 일곱 가지 속성 값의리스트와 함께 함수를 사용하기 만하면된다. 다음 코드는 해당 작업을 수행합니다. >> newPrediction <- 예측 (모델,
목록 (실린더 = 계수 (4), displacement = 370,마력 = 150, 가중치 = 3904, 가속도 = 12, modelYear
>> newPrediction fit lwr upr 1 14. 90128 8. 12795 21. 67462
회귀 모형에서 얻은 첫 번째 실제 예측입니다. 보이지 않는 데이터에 있기 때문에 결과를 알지 못하기 때문에 다른 것과 비교하여 올바른지 여부를 확인할 수 없습니다.
테스트 데이터 세트를 사용하여 모델을 평가 한 후에도 정확성에 만족하면 좋은 예측 모델을 만들었다는 확신을 가질 수 있습니다. 예측 모델의 효과를 측정하려면 비즈니스 결과가 나올 때까지 기다려야합니다.
더 나은 예측 모델을 만들기 위해 최적화 할 수 있습니다. 실험을 통해 더 빠르고 정확한 모델을 만들기위한 최적의 예측 변수 조합을 찾을 수 있습니다. 피쳐의 서브 세트를 구성하는 한 가지 방법은 변수들 간의 상관 관계를 찾고 고도로 상관 된 변수들을 제거하는 것이다. 적합성에 아무것도 추가하지 않거나 (또는 거의 정보를 추가하지 않는) 중복 변수를 제거하면 모델의 속도를 높일 수 있습니다. 처리 능력이나 속도가 문제가되는 많은 관찰 (데이터 행)을 처리 할 때 특히 그렇습니다.
큰 데이터 세트의 경우 데이터 행의 속성이 많을수록 처리 속도가 느려집니다. 따라서 최대한 많은 중복 정보를 제거해야합니다.