예측 분석 데이터 분류 프로세스의 기본 과정 - 브래스 경감 수준의 예측 분석 데이터에서 인력

비디오: WEB1 부록 : 코드의 힘 : 웹사이트 방문자 분석기 2024

브래스 경감 수준에서 예측 분석 데이터 분류는 학습 단계와 예측 단계의 두 단계로 구성됩니다. 학습 단계는 분류자를 통해 지정된 과거 데이터 세트를 실행함으로써 분류 모델을 훈련시키는 것을 수반한다. 목표는 숨겨진 관계와 규칙, 즉 역사적 (훈련) 데이터로부터 분류 규칙 을 추출하고 발견하도록 모델을 가르치는 것입니다. 모델은 분류 알고리즘을 사용하여 그렇게합니다.

이 단계를 설명하기 위해 시계를 판매하는 온라인 상점의 소유자라고 가정합니다. 당신은 잠시 동안 온라인 상점을 소유하고 있으며 상점에서 시계를 구입 한 고객에 대한 많은 거래 데이터와 개인 데이터를 수집했습니다. 작업을 통해 수집 한 트랜잭션 데이터 외에도 웹 양식을 제공하여 사이트를 통해 해당 데이터를 캡처했다고 가정합니다.

시계에 관심이없는 고객에 대한 정보를 제공하는 제 3 자로부터 데이터를 구입할 수도 있습니다. 그것은 소리가 나는 것처럼 어렵지 않습니다; 비즈니스 모델이 온라인으로 고객을 추적하고 이들에 대한 중요한 정보를 수집하고 판매하는 회사가 있습니다. 대부분의 제 3의 회사는 소셜 미디어 사이트에서 데이터를 수집하고 데이터 마이닝 방법을 적용하여 개별 사용자와 제품과의 관계를 발견합니다. 이 경우 시계 매장의 소유자는 고객과 시계 구입에 대한 관심 관계에 관심이 있습니다.

고객의 소셜 네트워크 프로필이나 트위터에서 찾은 정렬에 대한 마이크로 블로그 주석 등을 분석하여 이러한 유형의 정보를 추론 할 수 있습니다. 개인의 관심도를 측정하기 위해 개인의 서면 텍스트 (소셜 네트워크 상태, 짹짹, 블로그 게시 등) 또는 온라인 활동에서 이러한 상관 관계를 발견 할 수있는 몇 가지 텍스트 분석 도구를 적용 할 수 있습니다. 온라인 소셜 상호 작용, 사진 업로드 및 검색).

고객의 과거 거래 및 현재 관심사에 대한 모든 데이터 - 모범 사례를 보여주는

교육 데이터

를 수집 한 후에는이를 구성하는 구조로 구성해야합니다 쉽게 액세스하고 사용할 수 있습니다 (예: 데이터베이스).

이 단계에서 데이터 분류의 두 번째 단계, 즉 예측 단계, 는 모델 테스트 및 생성 된 분류 규칙의 정확성에 관한 것입니다. 이러한 목적으로

테스트 데이터 (교육 데이터와 다름)라고하는 추가적인 과거 고객 데이터가 필요할 것입니다. 이 테스트 데이터를 모델에 제공하고 예측 결과의 정확도를 측정합니다. 모델이 테스트 데이터에 나타난 고객의 향후 행동을 정확하게 예측 한 시간을 계산합니다. 모델이 잘못된 예측을 한 횟수도 계산합니다. 이 시점에서 가능한 결과는 두 가지뿐입니다. 모델의 정확성에 만족하거나 그렇지 않은 경우: 만족 스러우면 모델을 준비 할 수 있습니다. 예측을 생산 시스템의 일부로 간주합니다.

예측에 만족하지 않으면 새 교육 데이터 세트를 사용하여 모델을 재교육해야합니다.

원래 교육 데이터가 고객의 풀을 충분히 대표하지 못하거나 잘못된 신호가 유입되어 모델 결과를 폐기하는 시끄러운 데이터가 포함 된 경우에는 모델을 가동하여 실행하기위한 더 많은 작업이 필요합니다. 결과는 그 방법으로 유용합니다.