예측 모델의 분석 결과 - 더미

종종 예측 분석의 결과를 중요한 사람에게 보여줄 수 있어야합니다. 시각화 기법을 사용하여 모델의 결과를 이해 관계자에게보고하는 몇 가지 방법이 있습니다.

데이터의 숨겨진 그룹 시각화

데이터 클러스터링은 데이터에서 관련 항목의 숨겨진 그룹을 검색하는 프로세스입니다. 대부분의 경우 클러스터 (그룹화)는 소셜 네트워크 사용자, 텍스트 문서 또는 전자 메일과 같은 유형의 데이터 개체로 구성됩니다. 데이터 클러스터링 모델의 결과를 시각화하는 한 가지 방법은 아래에 나와 있으며, 그래프는 소셜 네트워크 사용자로부터 수집 된 데이터에서 발견 된 소셜 커뮤니티 (클러스터)를 나타냅니다.

고객에 관한 데이터는 표 형식으로 수집되었습니다. 클러스터링 알고리즘이 데이터에 적용되고 충성도가 높은 고객, 방랑하는 고객 및 할인 고객 인 세 클러스터 (그룹)가 발견되었습니다. X 축과 Y 축은 원본 데이터에서 생성 된 두 가지 주요 구성 요소를 나타냅니다. 주성분 분석 (PCA)은 데이터 감소 기술입니다.

세 그룹의 고객을 클러스터링: 충성도, 방황 및 할인.

여기서 세 그룹 간의 시각적 인 관계는 이미 강화 된 마케팅 목표가 가장 효과적 일 수있는 부분을 제시합니다.

데이터 분류 결과 시각화

분류 모델은 조사하는 새로운 데이터 포인트마다 특정 클래스를 할당합니다. 이 경우 특정 클래스는 클러스터링 작업으로 인해 생성 된 그룹 일 수 있습니다. 그래프에서 강조 표시된 출력이 대상 세트를 정의 할 수 있습니다. 주어진 신규 고객에 대해 예측 분류 모델은 신규 고객이 속할 그룹을 예측하려고 시도합니다.

이미지는 새로운 고객의 정보가 예측 분석 모델에 어떻게 전달되는지 보여 주며, 이는 다시이 새로운 고객이 속한 고객 그룹을 예측합니다. 새로운 고객 A, B 및 C는 분류 모델에 따라 클러스터에 할당 될 예정입니다. 분류 모델을 적용하면 고객 A는 충성 고객과, 고객 B는 방랑자로, 고객 C는 할인에 대해서만 나타납니다.
고객 A, B 및 C를 해당 분류 (클러스터)에 지정.
데이터의 아웃 라이어 구상하기

신규 고객을 클러스터링하거나 분류하는 과정에서 때때로 모든

아웃 라이어

(기존 부서에 맞지 않는 특별한 경우)가 발생합니다.

아래에는 미리 정의 된 클러스터에 잘 맞지 않는 몇 가지 특이점이 있습니다. 6 명의 이상한 고객이 감지되고 시각화되었습니다. 그들은 모델이 고객이 정의 된 범주에 속하는지 여부를 알 수 없을만큼 다르게 행동합니다. 6 명의 이상한 고객이 나타나기 만해도 분류에 어긋납니다. 의사 결정 트리의 시각화

많은 모델은

의사 결정 트리

를 출력으로 사용합니다.이 다이어그램은 트리의 분기와 같이 배치 된 대체 동작 과정에서 가능한 결과를 보여줍니다.

아래 이미지는 분류 자로 사용되는 나무의 예를 보여줍니다. 주로 티켓에 소비 된 금액과 구매 날짜를 기준으로 야구 팬을 분류합니다. 이 시각화를 통해 새로운 티켓 구매자가 될 팬 유형을 예측할 수 있습니다. 즉, 캐주얼, 충성도, 시류 변화, 치열한 경쟁 또는 다른 유형입니다. 각 팬의 속성은 트리의 각 레벨 (총 참가 게임 수, 총 지출량, 시즌)에서 언급됩니다. 특정 "루트"에서 트리의 특정 "리프"까지의 경로를 따라갈 수 있습니다. 여기에서 팬 클래스 (c1, c2, c3, c4, c5) 중 하나를 누르십시오. 특정 야구 팬이 속한 수업 찾기.

야구 팬의 유형을 결정하여 고객에게 보낼 마케팅 광고 유형을 결정할 수 있다고 가정 해 보겠습니다. 팀이 잘하고 플레이 오프로 향할 때 야구 광신자와 악 대차 팬이 새 차를 사도록 설득 당할 수 있다고 가정 해 보겠습니다.

마케팅 광고 및 할인을 보내 구매를 유도 할 수 있습니다. 또한, 특정 정치적 문제를 지원하기 위해 악의적 인 팬이 투표하도록 설득 될 수 있다고 가정합니다. 당신은 그들에게 그 지원을 요청하는 마케팅 광고를 보낼 수 있습니다. 팬 기반의 유형을 알고있는 경우 의사 결정 트리를 사용하면 고객 유형의 범위로 결정 트리를 접근하는 방법을 결정하는 데 도움이 될 수 있습니다.

예측 시각화

의사 결정 트리, 임의의 포리스트 및 몰려 들기 알고리즘을 포함하는 예측 분석 모델의 배열을 실행했다고 가정합니다. 모든 결과를 결합하여 모두가 지원하는 일관된 서술을 제공 할 수 있습니다. 여기서 신뢰는 수학 함수를 사용하여 계산할 수있는 수치 백분율입니다. 계산 결과는 가능한 발생 가능성의 점수를 캡슐화합니다.

x 축에서, 지원 증거는 가능한 결과를 식별 한 내용 분석 모델로 분석 된 컨텐츠 소스를 나타냅니다. 대부분의 경우, 예측 모델은 다양한 소스의 데이터를 사용하여 가능한 결과를 유도하는 대용량 데이터 집합을 처리했을 것입니다. 따라서 시각화에 가장 중요한 지원 증거 만 표시하면됩니다.

시각화에서 가장 중요한 지원 증거 만 보여줍니다.위와 같이 예측 분석을 적용하여 얻은 결과 요약은 가능한 결과를 보여주는 시각화와 신뢰도 점수 및 각각에 대한 뒷받침 증거로 제시됩니다. 세 가지 가능한 시나리오가 표시됩니다.

매주 최소 100 대를 Store S에 발송하지 않으면 품목 A의 재고가 계속 유지되지 않습니다 (신뢰도 98 %).

판매 수 품목 A의 생산량을 56 % 이상 늘리면 40 %가 증가합니다. (신뢰 점수: 83 %)

캘리포니아의 마케팅 캠페인은 항목 A와 D는 판매하지만 품목 K는 판매하지 않을 것입니다. (신뢰도 72 %)

신뢰도는 각 시나리오가 예측 분석 모델에 따라 발생합니다. 우도의 내림차순으로 나열됩니다.

가장 중요한 지원 증거는 여러 콘텐츠 소스의 발췌가 x 축 위에 표시되는 방식으로 구성됩니다. 특정 상황에 어떻게 대처해야 하는지를 설명해야 할 필요가있을 때이를 참조 할 수 있으며이를 지원하는 증거를 찾을 수 있습니다.
이 시각화의 힘은 단순합니다. 몇 달 간의 반복을 통해 데이터에 예측 분석을 적용한 후 의사 결정자와의 회의에 참여한다고 상상해보십시오. 비즈니스에 엄청난 영향을 미칠 수있는 세 가지 가능한 시나리오를 하나의 슬라이드 시각화로 무장합니다. 이러한 시각화는 효과적인 토론을 유도하고 경영진을 "아하"순간으로 이끌 수 있습니다.