개인 재정 R 분류 예측 분석 모델의 결과를 설명하는 방법 - 더미

R 분류 예측 분석 모델의 결과를 설명하는 방법 - 더미

비디오: [핵심 머신러닝] 수치예측, 범주예측 (분류) 2025

비디오: [핵심 머신러닝] 수치예측, 범주예측 (분류) 2025
Anonim

예측 분석의 또 다른 작업 독립 변수 집합이 주어지면 데이터의 대상 항목이 속한 클래스를 예측하여 새 데이터를 분류하는 것입니다. 예를 들어 의사 결정 트리를 사용하여 고객을 유형별로 분류 할 수 있습니다 (예: 고 가치 고객, 일반 고객 또는 경쟁 업체로 전환 할 준비가 된 고객).

R 분류 모델에 대한 유용한 정보를 보려면 다음 코드를 입력하십시오.

>> summary (model) 길이 클래스 모드 1 BinaryTree S4
클래스 열은 의사 결정 트리를 생성했음을 알려줍니다. 분할이 결정되는 방법을 보려면 다음과 같이 모델을 할당 한 변수의 이름을 입력하면됩니다. >> model 6 개의 터미널 노드가있는 조건부 추론 트리 응답: seedType 입력: 면적, 둘레, 간결함, 길이, 폭, 비대칭, 길이 2 관측 수: 147 1) 면적 <= 16 2; 기준 = 1, 통계 = 123 423 2) 면적 <= 13 37; 기준 = 1, 통계 = 63, 549 3) 길이 2 4.914 5) * 가중치 = 45 2) 영역> 13 37 6) 길이 2 5. 396 8) * 가중치 = 8 1) 영역> 16 2 9) 길이 2 5. 877 11) * weights = 40

이 코드를 사용하여 의사 결정 트리의 플롯을 작성하면 모델을 시각화 할 수 있습니다.> plot (model)


의사 결정 트리를 그래픽으로 표현한 것입니다. 전체 모양이 실제 나무 모양을 모방 한 것을 볼 수 있습니다.

노드

(원과 직사각형) 및 링크 또는 가장자리 (연결선)로 구성됩니다. 첫 번째 노드 (상단에서 시작)를 루트 노드

라고하고 트리의 하단에있는 노드 (사각형)를 터미널 노드 라고합니다. 5 개의 결정 노드와 6 개의 터미널 노드가 있습니다.

각 노드에서 모델은 원과 링크의 기준에 따라 결정을 내리고 이동 방법을 선택합니다. 모델이 터미널 노드에 도달하면 평결 또는 최종 결정에 도달합니다. 이 특정 경우에 두 가지 속성 인 the 및 the는 주어진 시드 유형이 클래스 1, 2 또는 3인지 여부를 결정하는 데 사용됩니다. 예를 들어 데이터 세트에서 관찰 # 2를 가져옵니다. 그것은 4.956과 14.88을가집니다. 방금 만든 트리를 사용하여이 관찰이 속한 특정 종자 유형을 결정할 수 있습니다. 다음은 일련의 단계입니다.

노드 1 인 루트 노드에서 시작합니다 (번호는 원의 상단에있는 작은 사각형에 표시됨). 속성에 따라 결정하십시오: 관측치 # 2가보다 작거나 같음 (= <=) 16.2? 대답은 '예'이므로 경로를 따라 노드 2로 이동하십시오.

노드 2에서 모델에서 묻는 질문: 영역 13입니까? 대답은 '예'입니다. 따라서 경로를 따라 노드 6으로 이동하십시오.이 노드에서 모델은 다음을 묻습니다. 길이 2 <= 5. 396입니까? 그것이 사실이고, 당신이 종단 노드 7로 이동하면, 관찰 # 2가 종자 유형 1이라는 평결이 나온다. 그리고 사실 그것은 종자 유형 1이다.

모델은 다른 모든 관측치가 수업.

  1. 좋은 모델을 훈련했는지 확인하려면 훈련 데이터와 대조하여 확인하십시오. 다음 코드를 사용하여 테이블에서 결과를 볼 수 있습니다. >> table (predict (model), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

  2. 오류 (또는 오 분류 비율)는 147 개 중 11 개 또는 7. 48 퍼센트입니다.

    계산 된 결과와 함께 다음 단계는 테이블을 읽는 것입니다.

  3. 정확한 예측은 열과 행의 숫자를 동일하게 표시합니다. 이러한 결과는 왼쪽 상단부터 오른쪽 하단까지 대각선으로 표시됩니다. 예를 들어, [1, 1], [2, 2], [3, 3]은 해당 클래스에 대한 올바른 예측의 수입니다. 따라서 종자 유형 1의 경우 모델은 정확히 45 번 예측했으나 종자 유형은 7 번 (종자 유형 2의 경우 4 배, 유형 3의 경우 3 배) 잘못 분류했습니다. 종자 유형 2의 경우, 모델은 정확하게 그것을 47 번 예측했으나 3 번 잘못 분류했습니다. 종자 유형 3의 경우, 모델은 정확히 한 번 잘못 오인하고 44 번 예측했습니다.

    이것은 좋은 모델임을 보여줍니다. 이제 테스트 데이터로 평가합니다. 다음은 나중에 사용할 수 있도록 테스트 데이터를 사용하여 변수를 예측 및 저장하는 코드입니다 ( test9). 테스트 데이터를 테이블에서보고 오류를 계산합니다. 코드는 다음과 같습니다. >> table (testPrediction, testSet $ ​​seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17 
    
    
R 분류 예측 분석 모델의 결과를 설명하는 방법 - 더미

편집자의 선택

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100은 라이브 뷰를 제공합니다.이 뷰는 사진을 찍을 때 모니터를 뷰 파인더로 사용합니다. 라이브 뷰를 켜는 것은 비디오 촬영 프로세스의 첫 번째 부분이기도합니다. 사실, 동영상을 촬영할 때 뷰 파인더 대신 모니터를 사용해야합니다. 라이브 뷰 사용 ...

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

뷰 파인더 대신에 모니터를 사용하여 사진을 구성하십시오. 많은면에서 라이브 뷰 모드에서 사진을 찍는 것은 일반적인 뷰 파인더 촬영과 다르지 않습니다. 그러나 초점을 포함하여 몇 가지 중요한 단계는 라이브 뷰를 전환 할 때 매우 다르게 작동합니다. 기본 사항 ...

편집자의 선택

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

원근감 평면이있는 이미지에서 사실적인 편집을 할 수 있습니다. 소실점을 사용하면 이미지에서 평면을 지정한 다음 다양한 기법을 사용하여 해당 평면에서 객체를 추가하거나 제거 할 수 있습니다. 편집이 필요한 이미지를 엽니 다. ...

Photoshop CC 픽셀의 측정, 계산 및 분석

Photoshop CC 픽셀의 측정, 계산 및 분석

연구원 및 과학자를 위해 설계된 < Photoshop CC의 측정 기능은 매우 강력합니다. 현미경이나 망원경으로 볼 수있는 기술적 인 이미지의 Whattvers 수를 계산할 수 있습니다. 이미지의 모든 요소의 정확한 크기를 알고 있으면 거의 모든 것을 발견 할 수 있습니다.

편집자의 선택

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티는 정착되지 않았습니다. 잊을 수없는 일. 최선의 시나리오는 꾸준하고 유기적 인 성장을 달성하는 것이지만, 진실은 하룻밤 사이에 발생하지 않는다는 것입니다. 한 번에 소수의 회원 만 있기 때문에 처음에는 좌절 할 수 있으며 고용주는 커뮤니티가 빠르게 성장하고 있다고 생각하지 않을 수도 있지만 진실은 ...

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

글꼴을 사용하면 최상의 사이트를 찾기가 어려울 수 있습니다. Google Web 글꼴 외에도 다음 목록은 무료 또는 유료로 글꼴을 찾는 데 내가 가장 좋아하는 장소를 알려줍니다. 글꼴 찾기 퀘스트를 진행하면서 친숙해질 필요가 있습니다.

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

온라인 커뮤니티가 일시적인 회원을 호스트한다는 것을 이해합니다. 그들은 장기간의 참가자들이지만, 대부분의 회원들은 여러 가지 이유로 잠시 후에 떠납니다. 종종 출발점은 커뮤니티 자체와는 아무런 관련이 없으며 다음 단계로 넘어갈 시간입니다.