개인 재정 CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

차례:

비디오: CRISP-DM | Data mining | Quick explanation 2024

비디오: CRISP-DM | Data mining | Quick explanation 2024
Anonim

모델링은 CRISP-DM (Cross-Industry Standard Process for Data Mining) 프로세스 모델의 일부로 대부분의 데이터 광부는 최고를 좋아한다. 귀하의 데이터는 이미 좋은 상태입니다. 이제 귀하는 귀하의 데이터에서 유용한 패턴을 검색 할 수 있습니다.

모델링 단계에는 네 가지 작업이 포함됩니다.

  • 모델링 기법 선택

  • 테스트 설계

  • 건물 모델

  • 모델 평가

작업: 모델링 기술 선택

놀라운 데이터 마이닝 세계는 모델링 기법을 제공하지만 모든 것이 사용자의 요구에 부합하지는 않습니다. 관련된 변수의 종류, 도구에서 사용할 수있는 기술 선택 및 중요한 비즈니스 고려 사항에 따라 목록을 좁히십시오. 예를 들어, 많은 조직에서는 해석하기 쉬운 결과를 가진 방법을 선호하므로 의사 결정 트리 또는 로지스틱 회귀가 허용 될 수 있지만 신경망은 허용되지 않을 수 있습니다.

모델링 기술:

사용할 기술을 지정하십시오.

  • 모델링 가정: 많은 모델링 기법은 특정 가정을 기반으로합니다. 예를 들어, 모델 유형은 특정 유형의 분배가있는 데이터와 함께 사용하기위한 것일 수 있습니다. 이 가정에이 보고서에 기록하십시오.

  • 통계 학자는 가정에 대해 잘 알고 엄격하며 까다 롭습니다. 데이터 광부가 반드시 그런 것은 아니며 데이터 광부가되는 것은 아닙니다. 통계 지식이 풍부하고 선택한 모델 뒤에있는 가정을 이해하면 가정에 대해 엄격하고 까다로운 작업을 수행 할 수 있습니다.

작업: 테스트 설계

이 작업의 테스트는 모델이 얼마나 잘 작동하는지 테스트하는 데 사용됩니다. 모델 교육을 위해 사례 그룹으로 데이터를 분할하고 모델 테스트를 위해 다른 그룹으로 나누는 것만 큼 간단 할 수 있습니다.

훈련 데이터는 수학적 형태를 데이터 모델에 맞추기 위해 사용되며, 테스트 데이터는 모델 교육 과정 중에 사용되어

overfitting을 방지합니다.

하나의 데이터 세트에는 완벽하지만 다른 모델은없는 모델을 만듭니다. 추가 테스트를 위해 모델 교육 과정에서 사용되지 않는

홀드 아웃 데이터, 데이터를 사용할 수도 있습니다. 이 작업의 결과물은 테스트 디자인입니다. 정교 할 필요는 없지만 교육 및 테스트 데이터가 비슷하고 데이터에 편향을주지 않도록주의해야합니다. Task: Building model (s) 모델링은 많은 사람들이 데이터 마이너의 모든 일을 생각하지만 수십 가지 작업 중 하나입니다! 그럼에도 불구하고 특정 비즈니스 목표를 처리하기위한 모델링은 데이터 마이닝 전문직의 핵심입니다.

이 작업의 산출물에는 세 가지 항목이 포함됩니다.

매개 변수 설정:

모델을 만들 때 대부분의 도구는 다양한 설정을 조정할 수있는 옵션을 제공하며 이러한 설정은 최종 모델의 구조에 영향을 미칩니다. 이러한 설정을 보고서에 기록하십시오.

모델 설명:

  • 모델을 설명하십시오. 모델의 유형 (선형 회귀 또는 신경망과 같은)과 사용 된 변수를 기술하십시오. 모델이 어떻게 해석되는지 설명하십시오. 모델링 프로세스에서 발생하는 어려움을 문서화하십시오. 모델:

  • 이 산출물은 모델 자체입니다. 일부 모델 유형은 간단한 방정식으로 쉽게 정의 할 수 있습니다. 다른 것들은 너무 복잡해서 더 정교한 형식으로 전송되어야합니다. 작업: 모델 평가

  • 기술적 관점 및 비즈니스 관점에서 작성한 모델을 검토합니다 (종종 프로젝트 팀의 비즈니스 전문가가 입력 한 정보를 사용). 모델 평가:

모델 검토에서 개발 된 정보를 요약합니다. 여러 모델을 만든 경우 특정 응용 프로그램에 대한 자신의 평가에 따라 모델을 평가할 수 있습니다.

수정 된 매개 변수 설정:

모델을 작성하는 데 사용 된 설정을 세부 조정하고 다른 모델링 라운드를 수행하여 결과를 개선 할 수 있습니다.

  • 양파, Dobos torte, 퇴적암과 같은 데이터 마이닝은 많은 레이어를 가지고 있습니다. 데이터 마이닝을 처음 시작할 때 매개 변수 설정을 기본값으로 두는 것으로 시작할 수 있습니다 (실제로 찾으려는 노력을하지 않는 한 옵션에주의하지 않을 수도 있습니다). 새로운 데이터 마이닝 경력에 익숙해지면 모델 매개 변수에 대해 알아보고이를 사용하는 방법을 알고 있어야합니다. 옵션은 모델 유형 및 사용중인 특정 도구에 따라 크게 달라집니다.

CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...