개인 재정 기계 학습의 교차 유효성 검사 - 더미

기계 학습의 교차 유효성 검사 - 더미

비디오: 5 1 Model Selection I 2024

비디오: 5 1 Model Selection I 2024
Anonim

경우에 따라 기계 학습을 위해서는 교차 유효성 검사에 의존해야합니다. 열차 / 테스트 세트의 눈에 띄는 문제점은 샘플링 트레이닝 데이터의 크기를 줄이기 때문에 실제로 테스트에 편향을 도입한다는 것입니다. 데이터를 분리하면 실제로 유용한 예제를 교육에서 제외시킬 수 있습니다. 또한 데이터가 매우 복잡하여 테스트 세트가 교육 세트와 유사하지만 값 조합이 다르기 때문에 (고도의 차원 데이터 세트에서 일반적 임) 교육 세트와 유사하지는 않은 경우가 있습니다.

이러한 문제는 많은 예제가 없을 때 샘플링 결과의 불안정성을 증가시킵니다. 불리한 방식으로 데이터를 분할 할 위험은 기계 학습 전문가가 기계 학습 솔루션을 평가하고 조정해야 할 때 열차 / 테스트 분할이 선호되는 솔루션이 아닌 이유를 설명합니다.

k- 폴드에 기반한 교차 검증은 실제로 해답입니다. 랜덤 분할에 의존하지만 이번에는 데이터를 동일한 크기의 폴드 (데이터의 일부) k 개로 나눕니다. 그런 다음 각 폴드가 테스트 세트로 차례로 유지되고 나머지는 트레이닝에 사용됩니다. 각 반복은 오류 추정을 생성하는 테스트와 다른 폴드를 사용합니다.

상호 유효성 검사의 작동 방식을 그래픽으로 나타냅니다.

이 절차는 다음과 같은 이점을 제공합니다.

중고 폴드 수를 늘리면 실제로 훈련 세트의 크기가 커지기 때문에 예제의 수에 관계없이 잘 작동합니다 (큰 k, 큰 훈련 세트, 편향 감소) 및 테스트 세트의 크기 감소.

  • 개별 접기에 대한 분배의 차이는 그다지 중요하지 않습니다. 폴드가 다른 폴드에 비해 분포가 다른 경우 폴트는 테스트 세트로 한 번만 사용되며 나머지 테스트 동안 트레이닝 세트의 일부로 다른 폴드와 혼합됩니다.
  • 실제로 모든 관측을 테스트하고 있으므로 모든 데이터를 사용하여 기계 학습 가설을 완전히 테스트하고 있습니다.
  • 결과의 평균을 취함으로써 예측 성능을 기대할 수 있습니다. 또한 결과의 표준 편차는 실제 샘플 밖의 데이터에서 얼마나 많은 편차가 발생할 수 있는지 알려줍니다. 교차 검증 된 퍼포먼스의 변화가 클수록 알고리즘이 적절하게 포착 할 수없는 매우 다양한 데이터가 있음을 알려줍니다.
  • 사용하는 데이터에 중요한 순서가있는 경우가 아니면 k- 교차 교차 유효성 검사를 사용하는 것이 항상 최적의 선택입니다. 예를 들어, 판매와 같은 시계열이 필요할 수 있습니다. 이 경우, 무작위 샘플링 방법을 사용해서는 안되며 원래의 시퀀스를 기반으로 한 열차 / 테스트 분할에 의존해야 순서가 유지되고 해당 순서 시리즈의 마지막 예제를 테스트 할 수 있습니다.
기계 학습의 교차 유효성 검사 - 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...