비디오: AWS 빅데이터 아키텍처 패턴 및 모범 사례 - 남궁영환 빅데이터 컨설턴트(AWS 코리아) 2024
귀하의 비즈니스가 예측 분석을 사용하여 더 나은 관리 또는 운영 결정을 내릴 수있는 방법으로 소개해야 할 때도 있습니다. 이 프로세스는 조사 단계부터 시작됩니다. 충분한 데이터가 있지만 현재 비즈니스 결정을 내리는 데 사용되지 않는 비즈니스에서 문제 영역을 식별합니다. 이러한 문제 영역을 파악하는 한 가지 방법은 애널리스트, 관리자 및 기타 의사 결정자와의 회의를 통해 그들이 반복적으로 위험하거나 어려운 결정을 내리는 지, 그리고 의사 결정을 지원하는 데 필요한 데이터의 종류를 묻는 것입니다. 과거 결정의 결과를 반영하는 데이터가 있다면 그 데이터를 활용할 준비를하십시오. 이 문제를 식별하는 프로세스를
발견 단계라고합니다.
데이터에서 무엇을 알고 싶습니까?
-
답을 얻을 때 취할 행동은 무엇입니까?
-
취해진 조치로 얻은 결과를 어떻게 측정 할 것입니까?
-
예측 분석 모델의 결과가 의미있는 통찰력을 얻는다면 누군가가 조치를 취해야합니다. 분명히, 당신은 그 행동의 결과가 조직에 비즈니스 가치를 추가 하는지를보고 싶어 할 것입니다. 따라서 운영 비용 절감, 매출 증대 또는 고객 유지 향상과 관련하여 그 가치를 측정 할 방법을 찾아야합니다.
데이터 과학자 또는 모델 작성자에게이 연습에서는 데이터 분류 모델을 개발하는 데 필수적인 단계 인 어떤 종류의 데이터를 분류하고 분석해야하는지 정의합니다. 기본 구별은 모델을 학습하는 데 사용할 데이터가 내부 또는 외부인지 여부입니다.
는 귀사와 관련이 있으며 일반적으로 귀사의 데이터 소스에서 가져온 것이며 구조화, 반 구조화 또는 비 구조화와 같은 많은 데이터 유형을 포함 할 수 있습니다.
-
외부 데이터 는 회사 외부에서 왔으며 종종 다른 회사에서 구입 한 데이터입니다.
-
모델에 사용하는 데이터가 내부 용인지 외부 용인지에 관계없이 먼저 모델을 평가해야합니다. 해당 평가에서 몇 가지 질문이 제기 될 수 있습니다. 해당 데이터가 얼마나 중요하고 정확한가? 너무 민감한 경우, 귀하의 목적을 달성하지 못할 수도 있습니다.
문제의 데이터가 얼마나 정확하고 그 정확성이 의심 스럽다면 그 유용성은 제한적입니다.
-
회사 정책 및 관련 법률에 따라 데이터를 사용하고 처리 할 수있는 방법은 무엇입니까? 발생할 수있는 법적 문제에 대해서는 법적 부서에서 데이터 사용을 삭제할 수 있습니다. (최근의 유명한 예는 첨부 된 사이드 바를 참조하십시오.)
-
모델 구축에 사용하기에 적합한 데이터를 식별하면 다음 단계로이를 분류하여 데이터 요소에 유용한 라벨을 만들고 적용합니다. 예를 들어, 고객의 구매 행동에 대한 데이터를 작업하는 경우 레이블은 일부 고객 그룹의 구매 방식에 따라 데이터 카테고리를 정의 할 수 있습니다.
-
계절 고객
은 정기적으로 쇼핑하거나 반 정기적으로.
-
할인 지향 고객 은 주요 할인이 제공 될 때만 쇼핑하는 경향이 있습니다.
-
충실한 고객 은 시간이 지남에 따라 제품을 많이 구매 한 고객입니다.
-
새로운 고객이 들어갈 범주를 예측하면 마케팅 팀에게 큰 가치가있을 수 있습니다. 아이디어는 효율적으로 시간과 돈을 들여 광고 할 고객을 확인하고, 추천 할 제품을 결정하고, 그렇게 할 수있는 최적의 시간을 선택하는 것입니다. 잘못된 고객을 타겟팅하면 많은 시간과 돈이 낭비 될 수 있습니다. 처음에는 제품을 판매하지 않은 경우보다 구매 가능성이 낮습니다. 타겟 마케팅에 대한 예측 분석을 사용하면 성공적인 캠페인을 목표로해야 할뿐만 아니라 함정이나 의도하지 않은 결과를 피할 수 있어야합니다.