개인 재정 R 회귀 분석을 사용하여 예측 분석 모델을 만드는 방법 - 예측을 만들려는

R 회귀 분석을 사용하여 예측 분석 모델을 만드는 방법 - 예측을 만들려는

비디오: 단순회귀분석(simple regression) - R을 활용한 계량분석 강의 노트 2024

비디오: 단순회귀분석(simple regression) - R을 활용한 계량분석 강의 노트 2024
Anonim

알려진 결과를 사용하여 평가할 수있는 예측 분석 모델을 만들고 싶습니다. 이를 위해 우리는 데이터 세트를 두 세트로 나눌 것입니다: 하나는 모델을 훈련시키는 모델이고 다른 하나는 모델을 테스트하는 모델입니다. 훈련과 시험 데이터 세트 사이의 70/30 분리가 충분합니다. 다음 두 줄의 코드는 각 집합의 크기를 계산하고 저장합니다. >> trainSize testSize <- nrow (autos)-trainSize

값을 출력하려면 값을 저장하는 데 사용되는 변수의 이름을 입력하고 엔터 키를 치시오. 출력은 다음과 같습니다.

>> trainSize [1] 279> testSize [1] 119

이 코드는 교육 및 테스트 데이터 세트를 만들려는 데이터 세트의 크기를 결정합니다. 당신은 여전히 ​​실제로 그 세트를 만들지 않았습니다. 또한 처음 279 개의 관측치를 호출하고 마지막 119 개의 관측치를 테스트 세트라고 부르기를 원하지는 않습니다. 데이터 집합이 정렬 된 것으로 나타나므로 나쁜 모델이 생성됩니다. 특히 modelYear 열은 작은 것부터 큰 것까지 정렬됩니다.

데이터를 조사해 보면, 무거운 8 기통 변위가 큰 마력이 큰 자동차의 대부분이 데이터 세트의 상단에 있다는 것을 알 수 있습니다. 이 관찰에서 데이터에 대한 알고리즘을 실행하지 않고도 다음과 같이 구형 자동차를 최신 자동차와 비교하여 (일반적으로이 데이터 세트의 경우) 말할 수 있습니다.

무거움

8 실린더가

  • 있음 큰 변위

  • 더 큰 마력을 가졌습니다.

    좋아요, 분명히 많은 사람들이 자동차에 대해 알고 있기 때문에 데이터를 본 후에 상관 관계가 무엇인지에 대한 추측은 너무 멀지 않을 것입니다. 많은 자동차 지식을 가진 사람은 이미 데이터를 보지 않고도 이것을 알고있을 것입니다.
  • 이것은 많은 사람들이 관련시킬 수있는 도메인 (자동차)의 단순한 예일뿐입니다. 그러나 이것이 암에 대한 데이터라면 대부분의 사람들은 각 속성의 의미를 즉시 이해하지 못합니다.

여기서는 도메인 전문가와 데이터 모델러가 모델링 프로세스에 필수적입니다. 도메인 전문가는 어떤 속성이 가장 중요한 (또는 가장 적게) 중요한지와 속성이 서로 어떻게 상호 관련되는지에 대해 가장 잘 알고있을 수 있습니다. 그들은 데이터 모델러에게 실험 할 변수를 제안 할 수 있습니다. 그들은 더 중요한 속성들에 더 큰 가중치들을 부여 할 수 있고 중요도가 가장 낮은 속성들에 작은 가중치를 부여 할 수도 있습니다 (또는 모두 제거 할 수도 있습니다).

따라서 전체 세트를 진정으로 대표하는 교육 데이터 세트 및 테스트 데이터 세트를 만들어야합니다. 이렇게하는 한 가지 방법은 전체 데이터 세트를 무작위로 선택하여 교육 세트를 만드는 것입니다.또한이 예제를 재현 가능하게 만들어 같은 예제에서 배울 수 있습니다.

랜덤 제네레이터의 시드를 설정하여 동일한 "임의"트레이닝 세트를 갖도록합니다. 다음 코드는 해당 작업을 수행합니다: >> set. trainSet testSet <- autos [-training_indices,]

훈련 세트에는 결과와 함께 279 개의 관측치가 포함되어 있습니다 (예: (mpg). 회귀 알고리즘은 결과를 사용하여 예측 변수 (7 가지 속성 중 하나)와 응답 변수 (mpg) 간의 관계를 조사하여 모델을 학습합니다. 테스트 세트는 나머지 데이터 (즉, 트레이닝 세트에 포함되지 않은 부분)를 포함한다. 테스트 세트에는 응답 (mpg) 변수도 포함됩니다.

테스트 집합과 함께 예측 함수를 사용하면 응답 변수를 무시하고 열 이름이 학습 집합의 열 이름과 동일한 경우에만 예측 변수를 사용합니다.

mpg 속성을 응답 변수로 사용하고 다른 모든 변수를 예측 변수로 사용하는 선형 회귀 모델을 만들려면 다음 코드 줄을 입력합니다. >> model <- lm (formula = trainSet $ ​​mpg ~., data = trainSet)

R 회귀 분석을 사용하여 예측 분석 모델을 만드는 방법 - 예측을 만들려는

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...