비디오: 인공신경망을 이용한 부도예측모형 구축 (IBM SPSS Modeler) 2024
Dummies 치트 시트를위한 예측 분석의 부분
성공적인 예측 분석 프로젝트가 단계적으로 실행됩니다. 프로젝트의 세부 사항에 몰두할 때 중요한 이정표를 살펴보십시오.
-
비즈니스 목표 정의
프로젝트는 잘 정의 된 비즈니스 목표를 사용하는 것으로 시작합니다. 이 모델은 비즈니스 질문을 다루기로되어 있습니다. 명확하게 그 목표를 밝히면 프로젝트의 범위를 정의 할 수 있으며 성공을 측정하기위한 정확한 테스트를 제공합니다.
-
데이터 준비
모델을 훈련시키는 데 이력 데이터를 사용합니다. 데이터는 일반적으로 여러 소스에 분산되어 있으며 정리 및 준비가 필요할 수 있습니다. 데이터에는 중복 레코드 및 이상 치가 포함될 수 있습니다. 분석 및 비즈니스 목표에 따라이를 유지할지 아니면 제거할지 결정합니다. 또한 데이터에 누락 된 값이있을 수 있으며 일부 변형을 수행해야 할 수도 있으며 목표에보다 많은 예측 능력을 가진 파생 된 특성을 생성하는 데 사용될 수도 있습니다. 전반적으로 데이터의 품질은 모델의 품질을 나타냅니다.
- -
데이터 샘플링
데이터를 두 세트로 나눠야합니다: 교육 및 테스트 데이터 세트. 교육 데이터 세트를 사용하여 모델을 작성합니다. 테스트 데이터 세트를 사용하여 모델 출력의 정확성을 확인합니다. 그렇게하는 것이 절대적으로 중요합니다. 그렇지 않으면 특정 데이터 세트에만 해당되는 모든 특성 (신호와 노이즈 모두)을 선택하는 시점에서 모델을 제한된 데이터 세트로 교육하여 모델을 과도하게 만들 위험이 있습니다. 특정 데이터 세트에 적합하지 않은 모델은 다른 데이터 세트에서 실행할 때 비참하게 수행됩니다. 테스트 데이터 세트는 모델의 성능을 정확하게 측정하는 올바른 방법을 보장합니다.
모델 구축 -
때로는 데이터 또는 비즈니스 목표가 특정 알고리즘 또는 모델에 적합합니다. 최선의 접근법이 그렇게 명확하지 않은 경우도 있습니다. 데이터를 탐색 할 때 가능한 한 많은 알고리즘을 실행하십시오. 그들의 결과를 비교하라. 전체 결과에 최종 모델을 선택하십시오. 때로는 데이터에 대한 앙상블을 동시에 실행하고 결과를 비교하여 최종 모델을 선택하는 것이 더 나을 때가 있습니다.
모델 배포
-
모델을 빌드 한 후에는 모델을 배포해야만 이점을 얻을 수 있습니다. 이 과정에는 다른 부서와의 조정이 필요할 수 있습니다. 배치 가능한 모델을 작성하십시오. 또한 비즈니스 이해 관계자에게 결과를 이해하고 설득력있게 제시하여 모델을 채택하는 방법을 알고 있어야합니다.모델을 배포 한 후에는 성능을 모니터링하고 성능을 계속 개선해야합니다. 대부분의 모델은 일정 기간 후에 감쇠합니다. 새로 사용 가능한 데이터로 새로 고침하여 모델을 최신 상태로 유지하십시오.