개인 재정 기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

비디오: Train/Dev/Test Set Distributions (C3W1L05) 2025

비디오: Train/Dev/Test Set Distributions (C3W1L05) 2025
Anonim

기계 학습 가설을 효과적으로 검증 할 수 있기 때문에 선택한 알고리즘을 더욱 최적화 할 수 있습니다. 이 알고리즘은 데이터에서 신호를 감지하고 예상치의 많은 차이를 과대하지 않고 예측 기능의 실제 기능 형태에 맞출 수 있으므로 데이터에 대한 예측 성능의 대부분을 제공합니다. 모든 기계 학습 알고리즘이 귀하의 데이터에 가장 잘 맞는 것은 아니며 모든 알고리즘을 하나의 알고리즘으로 해결할 수있는 것은 아닙니다. 특정 문제에 대해 올바른 것을 찾는 것은 당신에게 달려 있습니다.

최종 성능 소스는 학습이 발생하기 전에 결정하고 데이터에서 배운 매개 변수 인 알고리즘의

하이퍼 파라미터 를 미세 조정하면 파생됩니다. 이들의 역할은 알고리즘이 데이터와 상호 작용하고 다른 프로세스가 알고리즘을 데이터와 상호 작용하고 후속 적으로 알고리즘을 지정하고 최적화 프로세스를 사용하여 특정 매개 변수 값을 찾음에 반해 사전 정의 된 가설을 정의하는 데있다 좋은 예측을 얻는 데 더 잘 작동합니다. 복잡한 기계 학습 알고리즘은 추정치의 분산에 가장 많이 노출되는 알고리즘으로 많은 매개 변수로 표현되는 많은 선택 사항을 제공합니다. 그 (것)들을 가진 twiddling는 배우는 자료에 어느 정도 적응시킨다. 때로는 너무 많은 하이퍼 파라미터 twiddling이 알고리즘에서 데이터의 잘못된 신호를 감지하도록 만들 수 있습니다. 따라서 하이퍼 매개 변수 자체는 테스트 세트 또는 반복되는 교차 유효성 검사 스키마와 같은 고정 된 참조를 기반으로 너무 많이 조작하기 시작하면 감지 할 수없는 분산 소스가됩니다. R과 Python은 입력 행렬을 훈련, 테스트 및 유효성 검증 파트로 분할하는 기능을 제공합니다. 특히 교차 검증이나 부트 스트랩과 같은보다 복잡한 테스트 절차의 경우 Scikit-learn 패키지는 전체 모듈을 제공하고 R은 데이터 분할, 사전 처리 및 테스트 기능을 제공하는 특수 패키지를 제공합니다.이 패키지를 캐럿이라고합니다. 하이퍼 파라미터가 형성 할 수있는 값의 가능한 조합은 최적화를 찾기 어려운 위치를 결정합니다. 그래디언트 디센트를 설명 할 때 설명한 것처럼 최적화 공간에는 더 좋거나 나쁘게 수행되는 값 조합이 포함될 수 있습니다. 좋은 조합을 찾은 후에도 그것이 최선의 선택이라는 확신이 들지 않습니다. (이것은 오류를 최소화 할 때 로컬 미니 마에서 고생하는 문제입니다.)

이 문제를 해결하기위한 실제적인 방법으로 특정 데이터에 적용된 알고리즘의 하이퍼 매개 변수를 확인하는 가장 좋은 방법은 모두를 테스트하는 것입니다. 교차 유효성 검사를 수행하고 최상의 조합을 선택하십시오. 그리드 검색이라고하는이 간단한 접근법은 알고리즘에 체계적으로 입력 할 수있는 가능한 값의 범위를 샘플링하고 일반적인 최소값이 발생할 때를 탐지 할 수 있도록함으로써 뚜렷한 이점을 제공합니다. 반면에 그리드 검색은 연산 집약적이며 (현대 멀티 코어 컴퓨터에서이 작업을 병렬로 쉽게 수행 할 수 있기 때문에) 상당한 시간이 소요되기 때문에 심각한 단점이 있습니다. 또한 체계적이고 집중적 인 테스트는 오류가 발생할 가능성을 높여줍니다. 가짜 검증 결과는 데이터 세트에있는 노이즈로 인해 발생할 수 있기 때문입니다.

그리드 검색의 몇 가지 대안을 사용할 수 있습니다. 모든 것을 테스트하는 대신 계산적으로 무겁고 수학적으로 복잡한 비선형 최적화 기법 (예: Nelder-Mead 메서드)을 사용하여 가능한 하이퍼 매개 변수 값의 공간을 탐색하고 베이지안 방식을 사용하여 테스트의 수를 알아볼 수 있습니다 이전 결과의 장점) 또는 무작위 검색 사용.

놀랍게도 무작위 검색은 엄청나게 잘 작동하고, 이해하기 쉽고, 처음에는 눈이 멀 수도 있지만, 눈이 멀었을뿐입니다. 실제로 기술의 핵심은 충분한 무작위 테스트를 선택하면 유사하게 수행되는 조합의 약간 다른 조합을 테스트 할 때 에너지를 낭비하지 않으면 서 올바른 매개 변수를 발견 할 수있는 충분한 가능성이 있다는 것입니다.

아래 그림은 무작위 검색이 왜 잘 작동하는지 설명합니다. 체계적인 탐색은 유용하지만 모든 조합을 테스트하는 경향이 있습니다. 일부 매개 변수가 결과에 영향을주지 않으면 에너지 낭비가됩니다. 무작위 검색은 실제로 적은 수의 조합을 테스트하지만 각 하이퍼 매개 변수의 범위에서 더 많이 테스트합니다. 특정 매개 변수가 다른 매개 변수보다 중요 할 때 자주 승리하는 것으로 입증되는 전략입니다.

그리드 검색과 무작위 검색 비교.

무작위 검색이 잘 수행되도록하려면 15 회에서 최대 60 회까지 테스트해야합니다. 그리드 검색에 많은 수의 실험이 필요한 경우 무작위 검색을 사용하는 것이 좋습니다.

기계 학습에서 교차 검증 선택 최적화 - 기계 학습 가설을 유효하게 검증 할 수있는 더미

편집자의 선택

여성 건강 : 케겔 운동 방법 - 인형

여성 건강 : 케겔 운동 방법 - 인형

케겔 운동은 성기의 근육을 타겟으로합니다. 이 근육은 출산 중에 발생하는 스트레칭으로 인해 종종 약해지지만, 임신 한 적이없는 여성을 포함하여 어떤 여성이라도 적절한 케겔 (Kegel)을하는 법을 아는 것이 도움이 될 수 있습니다. 본질적으로 케겔 (Kegel)은 생식기에 좋은 운동을 제공하여 ...

폐경기 동안 기대할 사항 - 인형

폐경기 동안 기대할 사항 - 인형

폐경은 모든 여성의 삶의 사실입니다. 다른 연령대의 여러 단계의 증상으로 진행됩니다. 폐경의 결과로 여성은 알을 낳지 않고 생리를 멈추지 만 여성 호르몬, 에스트로겐 및 호르몬의 생성을 감소시킵니다.

여성 건강 : 요로 감염을 예방하는 방법 - 인형

여성 건강 : 요로 감염을 예방하는 방법 - 인형

요로 감염 (UTI)은 상당히 여성의 공통점. 통증이있는 ​​배뇨 나 잦은 소변과 같은 요로 감염의 증상을 발견하면 치료를받는 것이 중요합니다. UTI 치료는 일반적으로 항생제의 빠른 과정이지만 전문가의 도움을받는 데는 지체가 있으면 치료 시간이 길어질 수 있습니다. ...

편집자의 선택

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

많은 사람들을 위해 일하는 것과 비슷합니다. 많은 기업들이 혜택을 인식하고 있음에도 불구하고 습관을 버리는 것에 저항합니다. 사람들은 깨끗한 데이터가 시스템에 들어갈 수 있도록 시간을 할애하고 싶지 않지만 같은 사람들은 빨리 작업 할 수 있습니다 ...

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce의 모듈은 마케팅 프로그램을 관리, 추적 및 측정하는 데 사용하는 일련의 도구입니다. 캠페인 레코드는 캠페인 레코드입니다. 수동 또는 자동으로 리드, 연락처 및 / 또는 기회 레코드에 링크하여 캠페인에 대한 실제 메트릭을 제공 할 수 있습니다.

편집자의 선택

표시 관련 기사 Joomla 웹 사이트 - 인형

표시 관련 기사 Joomla 웹 사이트 - 인형

Joomla의 또 다른 멋진 모듈은 기사 - 관련 기사. 기사 - 관련 기사는 사이트 방문자가 보려고 선택한 기사와 관련된 기사를 표시하는 모듈입니다. 이 모듈은 현재 기사와 관련된 기사를 어떻게 알 수 있습니까? 그것은 메타 데이터에 입력 할 수있는 메타 데이터 키워드를 사용합니다 ...

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla는 세 가지 프런트 엔드 사용자, 백엔드 사용자 및 그 중간에있는 특수 클래스의 사용자 클래스가 있습니다. 이 클래스에는 3 개의 사용자 그룹이 있습니다. 작성자는 기사를 제출할 수 있습니다. 편집자는 새 기사를 제출하고 기존 기사를 편집 할 수 있습니다. 게시자는 새 기사를 제출하고 기존 기사를 편집하며 기사를 게시 할 수 있습니다. Joomla 사이트 작성자 작성 ...