비디오: Ch01_01.통계학의 이해(여론조사와 통계)01 2024
Dummies 치트 시트를위한 데이터 마이닝 부분
데이터 마이닝을위한 산업 간 표준 프로세스 ( CRISP-DM )는 데이터 마이닝 프로세스의 주요 프레임 워크입니다. 그것은 공개 표준입니다. 누구든지 그것을 사용할 수 있습니다. 다음 목록은 프로세스의 다양한 단계를 설명합니다.
-
비즈니스 이해: 해결해야 할 문제, 조직에 미치는 영향 및 해결 목표에 대한 명확한 이해를 얻으십시오. 이 단계의 작업은 다음과 같습니다.
-
비즈니스 목표 확인
-
상황 평가
-
데이터 마이닝 목표 정의
-
프로젝트 계획 수립
-
-
데이터 이해: 그것을 문서화하고, 데이터 관리 및 데이터 품질 문제를 식별합니다. 이 단계의 작업은 다음과 같습니다.
-
데이터 수집
-
설명
-
탐색
-
품질 확인
-
-
데이터 준비: 데이터를 모델링에 사용할 준비를하십시오. 이 단계의 작업에는 다음이 포함됩니다.
-
데이터 선택
-
데이터 정리
-
구성
-
통합
-
형식 지정
-
-
모델링: 수학적 기법을 사용하여 데이터 내의 패턴을 식별합니다. 이 단계의 작업은 다음과 같습니다.
-
기술 선택
-
테스트 설계
-
건물 모델
-
모델 평가
-
-
평가: 발견 한 패턴을 검토하고 비즈니스 사용 가능성을 평가합니다. 이 단계의 작업은 다음과 같습니다.
-
결과 평가
-
프로세스 검토
-
다음 단계 결정
-
-
배포: 발견 한 내용을 일상 업무에 적용하십시오. 이 단계의 작업에는 다음이 포함됩니다.
-
계획 배포 (데이터 마이닝 검색을 통합하기위한 사용자의 방법)
-
최종 결과보고
-
최종 결과 검토
-