개인 재정 기계 학습의 교차 유효성 검사 - 더미

기계 학습의 교차 유효성 검사 - 더미

비디오: 5 1 Model Selection I 2024

비디오: 5 1 Model Selection I 2024
Anonim

경우에 따라 기계 학습을 위해서는 교차 유효성 검사에 의존해야합니다. 열차 / 테스트 세트의 눈에 띄는 문제점은 샘플링 트레이닝 데이터의 크기를 줄이기 때문에 실제로 테스트에 편향을 도입한다는 것입니다. 데이터를 분리하면 실제로 유용한 예제를 교육에서 제외시킬 수 있습니다. 또한 데이터가 매우 복잡하여 테스트 세트가 교육 세트와 유사하지만 값 조합이 다르기 때문에 (고도의 차원 데이터 세트에서 일반적 임) 교육 세트와 유사하지는 않은 경우가 있습니다.

이러한 문제는 많은 예제가 없을 때 샘플링 결과의 불안정성을 증가시킵니다. 불리한 방식으로 데이터를 분할 할 위험은 기계 학습 전문가가 기계 학습 솔루션을 평가하고 조정해야 할 때 열차 / 테스트 분할이 선호되는 솔루션이 아닌 이유를 설명합니다.

k- 폴드에 기반한 교차 검증은 실제로 해답입니다. 랜덤 분할에 의존하지만 이번에는 데이터를 동일한 크기의 폴드 (데이터의 일부) k 개로 나눕니다. 그런 다음 각 폴드가 테스트 세트로 차례로 유지되고 나머지는 트레이닝에 사용됩니다. 각 반복은 오류 추정을 생성하는 테스트와 다른 폴드를 사용합니다.

상호 유효성 검사의 작동 방식을 그래픽으로 나타냅니다.

이 절차는 다음과 같은 이점을 제공합니다.

중고 폴드 수를 늘리면 실제로 훈련 세트의 크기가 커지기 때문에 예제의 수에 관계없이 잘 작동합니다 (큰 k, 큰 훈련 세트, 편향 감소) 및 테스트 세트의 크기 감소.

  • 개별 접기에 대한 분배의 차이는 그다지 중요하지 않습니다. 폴드가 다른 폴드에 비해 분포가 다른 경우 폴트는 테스트 세트로 한 번만 사용되며 나머지 테스트 동안 트레이닝 세트의 일부로 다른 폴드와 혼합됩니다.
  • 실제로 모든 관측을 테스트하고 있으므로 모든 데이터를 사용하여 기계 학습 가설을 완전히 테스트하고 있습니다.
  • 결과의 평균을 취함으로써 예측 성능을 기대할 수 있습니다. 또한 결과의 표준 편차는 실제 샘플 밖의 데이터에서 얼마나 많은 편차가 발생할 수 있는지 알려줍니다. 교차 검증 된 퍼포먼스의 변화가 클수록 알고리즘이 적절하게 포착 할 수없는 매우 다양한 데이터가 있음을 알려줍니다.
  • 사용하는 데이터에 중요한 순서가있는 경우가 아니면 k- 교차 교차 유효성 검사를 사용하는 것이 항상 최적의 선택입니다. 예를 들어, 판매와 같은 시계열이 필요할 수 있습니다. 이 경우, 무작위 샘플링 방법을 사용해서는 안되며 원래의 시퀀스를 기반으로 한 열차 / 테스트 분할에 의존해야 순서가 유지되고 해당 순서 시리즈의 마지막 예제를 테스트 할 수 있습니다.
기계 학습의 교차 유효성 검사 - 더미

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...