개인 재정 SVM 감독 학습 모델에서 훈련 데이터를 실행하는 방법 - 먹이를 채우기 전에 더미

SVM 감독 학습 모델에서 훈련 데이터를 실행하는 방법 - 먹이를 채우기 전에 더미

비디오: 빅데이터(Big Data) 기반 지능형 학술정보서비스 2024

비디오: 빅데이터(Big Data) 기반 지능형 학술정보서비스 2024
Anonim

예측 분석을 위해로드 된 데이터로 SVM (Support Vector Machine) 분류자를 공급하려면 먼저 전체 데이터 집합을 학습 집합으로 분할하고 테스트 세트.

다행스럽게도 scikit-learn은 전체 데이터 집합을 쉽게 분리하는 데 도움이되는 함수를 구현했습니다. train_test_split 함수는 하나의 데이터 세트와 백분율 값을 입력으로받습니다. 백분율 값은 테스트 세트의 크기를 결정하는 데 사용됩니다. 이 함수는 테스트 데이터 집합 (크기가 지정된 경우)과 학습 데이터 집합 (나머지 데이터를 사용하는 경우)의 두 가지 데이터 집합을 반환합니다.

다음 코드를 입력하여 데이터 집합을 분할합니다. >>>> sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. test_size = 0.10, random_state = 111)

첫 번째 행은 교차 유효성 검사 라이브러리를 세션으로 가져옵니다. 두 번째 줄은 샘플의 10 %에서 테스트 세트를 생성합니다.


x_train은 135 개의 관측치와 특징을 포함합니다.

y_train은 135 개의 관측과 동일한 순서로 135 개의 레이블을 포함합니다.

x_test는 15 (또는 10 %)의 관측치와 특징을 포함합니다.

y_test는 15 개의 관측과 동일한 순서로 15 개의 레이블을 포함합니다.

다음 코드는 분할이 예상 한 것임을 확인합니다.

>>>> X_train. shape (135, 4) >>> y_train. shape (135,) >>> X_test. shape (15, 4) >>> y_test. 모양 (15,)

훈련에서 4 개의 특징과 135 개의 라벨이있는 135 개의 관찰이 출력되었음을 알 수 있습니다. 테스트 세트에는 4 개의 기능과 15 개의 라벨이 포함 된 15 개의 관찰이 있습니다.

예측 분석 분야의 많은 초보자들은 데이터 세트를 분리하는 것을 잊어 버립니다. 이는 심각한 설계 결함을 프로젝트에 도입합니다. 전체 150 개의 인스턴스가 교육 데이터로 시스템에로드 된 경우 모델 테스트를위한 보이지 않는 데이터는 남지 않습니다. 그런 다음 예측 모델을 테스트하기 위해 일부 교육 인스턴스 재사용에 의존해야합니다.
이와 같은 상황에서 모델을 훈련하는 데 사용한 것과 동일한 정확한 데이터를 사용하기 때문에 모델은 항상 올바른 클래스를 예측한다는 것을 알 수 있습니다.모델은 이전에 이미이 패턴을 보았습니다. 보이는 그대로 반복해도 문제가 없습니다. 작동 예측 모델은 아직 보지 못한 데이터에 대한 예측을해야합니다.

SVM 분류 자, 학습 데이터 집합 및 테스트 데이터 집합의 인스턴스가 있으면 교육 데이터로 모델을 학습 할 준비가 된 것입니다. 인터프리터에 다음 코드를 입력하면 정확히 >>>> svmClassifier가됩니다. fit (X_train, y_train)

이 코드 라인은 예측을 할 수있는 작업 모델을 만듭니다. 특히, 레이블이 지정되지 않은 새 데이터 세트가 속한 아이리스의 클래스를 예측하는 예측 모델입니다. svmClassifier 인스턴스에는 다양한 작업을 수행하기 위해 호출 할 수있는 몇 가지 메소드가 있습니다.

예를 들어, fit 메소드를 호출 한 후에 가장 유용한 호출 메소드는 predict 메소드입니다. 이것이 새로운 데이터를 제공하는 방법입니다. 그 대가로 결과를 예측합니다.

SVM 감독 학습 모델에서 훈련 데이터를 실행하는 방법 - 먹이를 채우기 전에 더미

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...