개인 재정 CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

차례:

비디오: CRISP-DM | Data mining | Quick explanation 2025

비디오: CRISP-DM | Data mining | Quick explanation 2025
Anonim

모델링은 CRISP-DM (Cross-Industry Standard Process for Data Mining) 프로세스 모델의 일부로 대부분의 데이터 광부는 최고를 좋아한다. 귀하의 데이터는 이미 좋은 상태입니다. 이제 귀하는 귀하의 데이터에서 유용한 패턴을 검색 할 수 있습니다.

모델링 단계에는 네 가지 작업이 포함됩니다.

  • 모델링 기법 선택

  • 테스트 설계

  • 건물 모델

  • 모델 평가

작업: 모델링 기술 선택

놀라운 데이터 마이닝 세계는 모델링 기법을 제공하지만 모든 것이 사용자의 요구에 부합하지는 않습니다. 관련된 변수의 종류, 도구에서 사용할 수있는 기술 선택 및 중요한 비즈니스 고려 사항에 따라 목록을 좁히십시오. 예를 들어, 많은 조직에서는 해석하기 쉬운 결과를 가진 방법을 선호하므로 의사 결정 트리 또는 로지스틱 회귀가 허용 될 수 있지만 신경망은 허용되지 않을 수 있습니다.

모델링 기술:

사용할 기술을 지정하십시오.

  • 모델링 가정: 많은 모델링 기법은 특정 가정을 기반으로합니다. 예를 들어, 모델 유형은 특정 유형의 분배가있는 데이터와 함께 사용하기위한 것일 수 있습니다. 이 가정에이 보고서에 기록하십시오.

  • 통계 학자는 가정에 대해 잘 알고 엄격하며 까다 롭습니다. 데이터 광부가 반드시 그런 것은 아니며 데이터 광부가되는 것은 아닙니다. 통계 지식이 풍부하고 선택한 모델 뒤에있는 가정을 이해하면 가정에 대해 엄격하고 까다로운 작업을 수행 할 수 있습니다.

작업: 테스트 설계

이 작업의 테스트는 모델이 얼마나 잘 작동하는지 테스트하는 데 사용됩니다. 모델 교육을 위해 사례 그룹으로 데이터를 분할하고 모델 테스트를 위해 다른 그룹으로 나누는 것만 큼 간단 할 수 있습니다.

훈련 데이터는 수학적 형태를 데이터 모델에 맞추기 위해 사용되며, 테스트 데이터는 모델 교육 과정 중에 사용되어

overfitting을 방지합니다.

하나의 데이터 세트에는 완벽하지만 다른 모델은없는 모델을 만듭니다. 추가 테스트를 위해 모델 교육 과정에서 사용되지 않는

홀드 아웃 데이터, 데이터를 사용할 수도 있습니다. 이 작업의 결과물은 테스트 디자인입니다. 정교 할 필요는 없지만 교육 및 테스트 데이터가 비슷하고 데이터에 편향을주지 않도록주의해야합니다. Task: Building model (s) 모델링은 많은 사람들이 데이터 마이너의 모든 일을 생각하지만 수십 가지 작업 중 하나입니다! 그럼에도 불구하고 특정 비즈니스 목표를 처리하기위한 모델링은 데이터 마이닝 전문직의 핵심입니다.

이 작업의 산출물에는 세 가지 항목이 포함됩니다.

매개 변수 설정:

모델을 만들 때 대부분의 도구는 다양한 설정을 조정할 수있는 옵션을 제공하며 이러한 설정은 최종 모델의 구조에 영향을 미칩니다. 이러한 설정을 보고서에 기록하십시오.

모델 설명:

  • 모델을 설명하십시오. 모델의 유형 (선형 회귀 또는 신경망과 같은)과 사용 된 변수를 기술하십시오. 모델이 어떻게 해석되는지 설명하십시오. 모델링 프로세스에서 발생하는 어려움을 문서화하십시오. 모델:

  • 이 산출물은 모델 자체입니다. 일부 모델 유형은 간단한 방정식으로 쉽게 정의 할 수 있습니다. 다른 것들은 너무 복잡해서 더 정교한 형식으로 전송되어야합니다. 작업: 모델 평가

  • 기술적 관점 및 비즈니스 관점에서 작성한 모델을 검토합니다 (종종 프로젝트 팀의 비즈니스 전문가가 입력 한 정보를 사용). 모델 평가:

모델 검토에서 개발 된 정보를 요약합니다. 여러 모델을 만든 경우 특정 응용 프로그램에 대한 자신의 평가에 따라 모델을 평가할 수 있습니다.

수정 된 매개 변수 설정:

모델을 작성하는 데 사용 된 설정을 세부 조정하고 다른 모델링 라운드를 수행하여 결과를 개선 할 수 있습니다.

  • 양파, Dobos torte, 퇴적암과 같은 데이터 마이닝은 많은 레이어를 가지고 있습니다. 데이터 마이닝을 처음 시작할 때 매개 변수 설정을 기본값으로 두는 것으로 시작할 수 있습니다 (실제로 찾으려는 노력을하지 않는 한 옵션에주의하지 않을 수도 있습니다). 새로운 데이터 마이닝 경력에 익숙해지면 모델 매개 변수에 대해 알아보고이를 사용하는 방법을 알고 있어야합니다. 옵션은 모델 유형 및 사용중인 특정 도구에 따라 크게 달라집니다.

CRISP-DM 프로세스의 4 단계 : 모델링 - 더미

편집자의 선택

여성 건강 : 케겔 운동 방법 - 인형

여성 건강 : 케겔 운동 방법 - 인형

케겔 운동은 성기의 근육을 타겟으로합니다. 이 근육은 출산 중에 발생하는 스트레칭으로 인해 종종 약해지지만, 임신 한 적이없는 여성을 포함하여 어떤 여성이라도 적절한 케겔 (Kegel)을하는 법을 아는 것이 도움이 될 수 있습니다. 본질적으로 케겔 (Kegel)은 생식기에 좋은 운동을 제공하여 ...

폐경기 동안 기대할 사항 - 인형

폐경기 동안 기대할 사항 - 인형

폐경은 모든 여성의 삶의 사실입니다. 다른 연령대의 여러 단계의 증상으로 진행됩니다. 폐경의 결과로 여성은 알을 낳지 않고 생리를 멈추지 만 여성 호르몬, 에스트로겐 및 호르몬의 생성을 감소시킵니다.

여성 건강 : 요로 감염을 예방하는 방법 - 인형

여성 건강 : 요로 감염을 예방하는 방법 - 인형

요로 감염 (UTI)은 상당히 여성의 공통점. 통증이있는 ​​배뇨 나 잦은 소변과 같은 요로 감염의 증상을 발견하면 치료를받는 것이 중요합니다. UTI 치료는 일반적으로 항생제의 빠른 과정이지만 전문가의 도움을받는 데는 지체가 있으면 치료 시간이 길어질 수 있습니다. ...

편집자의 선택

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

많은 사람들을 위해 일하는 것과 비슷합니다. 많은 기업들이 혜택을 인식하고 있음에도 불구하고 습관을 버리는 것에 저항합니다. 사람들은 깨끗한 데이터가 시스템에 들어갈 수 있도록 시간을 할애하고 싶지 않지만 같은 사람들은 빨리 작업 할 수 있습니다 ...

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce의 모듈은 마케팅 프로그램을 관리, 추적 및 측정하는 데 사용하는 일련의 도구입니다. 캠페인 레코드는 캠페인 레코드입니다. 수동 또는 자동으로 리드, 연락처 및 / 또는 기회 레코드에 링크하여 캠페인에 대한 실제 메트릭을 제공 할 수 있습니다.

편집자의 선택

표시 관련 기사 Joomla 웹 사이트 - 인형

표시 관련 기사 Joomla 웹 사이트 - 인형

Joomla의 또 다른 멋진 모듈은 기사 - 관련 기사. 기사 - 관련 기사는 사이트 방문자가 보려고 선택한 기사와 관련된 기사를 표시하는 모듈입니다. 이 모듈은 현재 기사와 관련된 기사를 어떻게 알 수 있습니까? 그것은 메타 데이터에 입력 할 수있는 메타 데이터 키워드를 사용합니다 ...

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla는 세 가지 프런트 엔드 사용자, 백엔드 사용자 및 그 중간에있는 특수 클래스의 사용자 클래스가 있습니다. 이 클래스에는 3 개의 사용자 그룹이 있습니다. 작성자는 기사를 제출할 수 있습니다. 편집자는 새 기사를 제출하고 기존 기사를 편집 할 수 있습니다. 게시자는 새 기사를 제출하고 기존 기사를 편집하며 기사를 게시 할 수 있습니다. Joomla 사이트 작성자 작성 ...