개인 재정 기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

비디오: Train/Dev/Test Set Distributions (C3W1L05) 2024

비디오: Train/Dev/Test Set Distributions (C3W1L05) 2024
Anonim

기계 학습 가설을 효과적으로 검증 할 수 있기 때문에 선택한 알고리즘을 더욱 최적화 할 수 있습니다. 이 알고리즘은 데이터에서 신호를 감지하고 예상치의 많은 차이를 과대하지 않고 예측 기능의 실제 기능 형태에 맞출 수 있으므로 데이터에 대한 예측 성능의 대부분을 제공합니다. 모든 기계 학습 알고리즘이 귀하의 데이터에 가장 잘 맞는 것은 아니며 모든 알고리즘을 하나의 알고리즘으로 해결할 수있는 것은 아닙니다. 특정 문제에 대해 올바른 것을 찾는 것은 당신에게 달려 있습니다.

최종 성능 소스는 학습이 발생하기 전에 결정하고 데이터에서 배운 매개 변수 인 알고리즘의

하이퍼 파라미터 를 미세 조정하면 파생됩니다. 이들의 역할은 알고리즘이 데이터와 상호 작용하고 다른 프로세스가 알고리즘을 데이터와 상호 작용하고 후속 적으로 알고리즘을 지정하고 최적화 프로세스를 사용하여 특정 매개 변수 값을 찾음에 반해 사전 정의 된 가설을 정의하는 데있다 좋은 예측을 얻는 데 더 잘 작동합니다. 복잡한 기계 학습 알고리즘은 추정치의 분산에 가장 많이 노출되는 알고리즘으로 많은 매개 변수로 표현되는 많은 선택 사항을 제공합니다. 그 (것)들을 가진 twiddling는 배우는 자료에 어느 정도 적응시킨다. 때로는 너무 많은 하이퍼 파라미터 twiddling이 알고리즘에서 데이터의 잘못된 신호를 감지하도록 만들 수 있습니다. 따라서 하이퍼 매개 변수 자체는 테스트 세트 또는 반복되는 교차 유효성 검사 스키마와 같은 고정 된 참조를 기반으로 너무 많이 조작하기 시작하면 감지 할 수없는 분산 소스가됩니다. R과 Python은 입력 행렬을 훈련, 테스트 및 유효성 검증 파트로 분할하는 기능을 제공합니다. 특히 교차 검증이나 부트 스트랩과 같은보다 복잡한 테스트 절차의 경우 Scikit-learn 패키지는 전체 모듈을 제공하고 R은 데이터 분할, 사전 처리 및 테스트 기능을 제공하는 특수 패키지를 제공합니다.이 패키지를 캐럿이라고합니다. 하이퍼 파라미터가 형성 할 수있는 값의 가능한 조합은 최적화를 찾기 어려운 위치를 결정합니다. 그래디언트 디센트를 설명 할 때 설명한 것처럼 최적화 공간에는 더 좋거나 나쁘게 수행되는 값 조합이 포함될 수 있습니다. 좋은 조합을 찾은 후에도 그것이 최선의 선택이라는 확신이 들지 않습니다. (이것은 오류를 최소화 할 때 로컬 미니 마에서 고생하는 문제입니다.)

이 문제를 해결하기위한 실제적인 방법으로 특정 데이터에 적용된 알고리즘의 하이퍼 매개 변수를 확인하는 가장 좋은 방법은 모두를 테스트하는 것입니다. 교차 유효성 검사를 수행하고 최상의 조합을 선택하십시오. 그리드 검색이라고하는이 간단한 접근법은 알고리즘에 체계적으로 입력 할 수있는 가능한 값의 범위를 샘플링하고 일반적인 최소값이 발생할 때를 탐지 할 수 있도록함으로써 뚜렷한 이점을 제공합니다. 반면에 그리드 검색은 연산 집약적이며 (현대 멀티 코어 컴퓨터에서이 작업을 병렬로 쉽게 수행 할 수 있기 때문에) 상당한 시간이 소요되기 때문에 심각한 단점이 있습니다. 또한 체계적이고 집중적 인 테스트는 오류가 발생할 가능성을 높여줍니다. 가짜 검증 결과는 데이터 세트에있는 노이즈로 인해 발생할 수 있기 때문입니다.

그리드 검색의 몇 가지 대안을 사용할 수 있습니다. 모든 것을 테스트하는 대신 계산적으로 무겁고 수학적으로 복잡한 비선형 최적화 기법 (예: Nelder-Mead 메서드)을 사용하여 가능한 하이퍼 매개 변수 값의 공간을 탐색하고 베이지안 방식을 사용하여 테스트의 수를 알아볼 수 있습니다 이전 결과의 장점) 또는 무작위 검색 사용.

놀랍게도 무작위 검색은 엄청나게 잘 작동하고, 이해하기 쉽고, 처음에는 눈이 멀 수도 있지만, 눈이 멀었을뿐입니다. 실제로 기술의 핵심은 충분한 무작위 테스트를 선택하면 유사하게 수행되는 조합의 약간 다른 조합을 테스트 할 때 에너지를 낭비하지 않으면 서 올바른 매개 변수를 발견 할 수있는 충분한 가능성이 있다는 것입니다.

아래 그림은 무작위 검색이 왜 잘 작동하는지 설명합니다. 체계적인 탐색은 유용하지만 모든 조합을 테스트하는 경향이 있습니다. 일부 매개 변수가 결과에 영향을주지 않으면 에너지 낭비가됩니다. 무작위 검색은 실제로 적은 수의 조합을 테스트하지만 각 하이퍼 매개 변수의 범위에서 더 많이 테스트합니다. 특정 매개 변수가 다른 매개 변수보다 중요 할 때 자주 승리하는 것으로 입증되는 전략입니다.

그리드 검색과 무작위 검색 비교.

무작위 검색이 잘 수행되도록하려면 15 회에서 최대 60 회까지 테스트해야합니다. 그리드 검색에 많은 수의 실험이 필요한 경우 무작위 검색을 사용하는 것이 좋습니다.

기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...