차례:
- 예측 분석 솔루션을 구축하고 지원하는 것이 유일한 업무 인 데이터 과학 팀을 고용하십시오. 비즈니스 분석가, 데이터 과학자 및 정보 기술자로 구성된 재능있는 전문가 팀이 전임 프로젝트에서보다 효과적으로 작업 할 수 있습니다. 전문적인 배경을 포함하면 다른 영역의 팀에게 중요한 통찰력을 줄 수 있습니다. 조직의 여러 부서에서 팀 구성원을 선택하면 광범위한 구매를 보장 할 수 있습니다.
- 시각화는 복잡한 아이디어를 효율적으로 전달하는 강력한 방법입니다. 효과적으로 시각화를 사용하면 작업중인 데이터를 처음에 탐색하고 이해하는 데 도움이됩니다.차트와 같은 시각 자료도 모델의 산출물을 평가하거나 예측 모델의 성능을 비교하는 데 도움이 될 수 있습니다.
- 강력한 예측 분석 도구는 시장에서 소프트웨어 패키지로 제공됩니다. 전체 프로세스를 훨씬 쉽게 할 수 있도록 설계되었습니다. 이러한 도구를 사용하지 않으면 처음부터 모델을 신속하게 구축하는 데 많은 시간이 소요됩니다. 우수한 예측 분석 도구를 사용하면 여러 시나리오를 실행하고 몇 번의 클릭만으로 결과를 즉각적으로 비교할 수 있습니다. 도구는 하나 이상의 모델을 작성하고 평가하는 데 필요한 많은 시간이 소요되는 단계를 신속하게 자동화 할 수 있습니다.
비디오: Kaggle 도전기: Titanic - 캐글 타이타닉 2024
Anasse Bari, Mohamed Chaouchi, Tommy Jung
예측 분석 프로젝트는 세부 묘사와 큰 그림 사고를 결합합니다. 이 편리한 팁과 체크리스트는 프로젝트를 레일과 숲 밖으로 유지하는 데 도움이됩니다.
예측 분석 모델 구축
성공적인 예측 분석 프로젝트가 단계적으로 실행됩니다. 프로젝트의 세부 사항에 몰두할 때 중요한 이정표를 지켜보십시오.
-
비즈니스 목표 정의
프로젝트는 잘 정의 된 비즈니스 목표를 사용하는 것으로 시작합니다. 이 모델은 비즈니스 질문을 다루기로되어 있습니다. 명확하게 그 목표를 밝히면 프로젝트의 범위를 정의 할 수 있으며 성공을 측정하기위한 정확한 테스트를 제공합니다.
-
데이터 준비
모델을 훈련시키는 데 히스토리 데이터를 사용합니다. 데이터는 일반적으로 여러 소스에 분산되어 있으며 정리 및 준비가 필요할 수 있습니다. 데이터에는 중복 레코드 및 이상 치가 포함될 수 있습니다. 분석 및 비즈니스 목표에 따라이를 유지할지 아니면 제거할지 결정합니다. 또한 데이터에 누락 된 값이있을 수 있으며 일부 변형을 수행해야 할 수도 있으며 목표에보다 많은 예측 능력을 가진 파생 된 특성을 생성하는 데 사용될 수도 있습니다. 전반적으로 데이터의 품질은 모델의 품질을 나타냅니다.
- -
데이터 샘플링
데이터를 두 세트로 나눠야합니다: 교육 및 테스트 데이터 세트. 교육 데이터 세트를 사용하여 모델을 작성합니다. 테스트 데이터 세트를 사용하여 모델 출력의 정확성을 확인합니다. 그렇게하는 것이 절대적으로 중요합니다. 그렇지 않으면 특정 데이터 세트에만 해당되는 모든 특성 (신호와 노이즈 모두)을 선택하는 시점에서 모델을 제한된 데이터 세트로 교육하여 모델을 과도하게 만들 위험이 있습니다. 특정 데이터 세트에 적합하지 않은 모델은 다른 데이터 세트에서 실행할 때 비참하게 수행됩니다. 테스트 데이터 세트는 모델의 성능을 정확하게 측정하는 올바른 방법을 보장합니다.
모델 구축 -
때로는 데이터 또는 비즈니스 목표가 특정 알고리즘 또는 모델에 적합합니다. 최선의 접근법이 그렇게 명확하지 않은 경우도 있습니다. 데이터를 탐색 할 때 가능한 한 많은 알고리즘을 실행하십시오. 그들의 결과를 비교하라. 전체 결과에 최종 모델을 선택하십시오. 때로는 데이터에 대한 앙상블을 동시에 실행하고 결과를 비교하여 최종 모델을 선택하는 것이 더 나을 때가 있습니다.
모델 배포
-
모델을 빌드 한 후 이점을 얻기 위해 모델을 배포해야합니다. 이 과정에는 다른 부서와의 조정이 필요할 수 있습니다.배치 가능한 모델을 작성하십시오. 또한 비즈니스 이해 관계자에게 결과를 이해하고 설득력있게 제시하여 모델을 채택하는 방법을 알고 있어야합니다. 모델을 배포 한 후에는 성능을 모니터링하고 성능을 계속 개선해야합니다. 대부분의 모델은 일정 기간 후에 감쇠합니다. 새로 사용 가능한 데이터로 새로 고침하여 모델을 최신 상태로 유지하십시오.
예측 분석 프로젝트를위한 데이터 소스
예측 분석 프로젝트를위한 데이터는 다양한 출처에서 나올 수 있습니다. 가장 일반적인 출처 중 일부는 귀하의 조직 내에 있습니다. 다른 일반적인 출처에는 외부 공급 업체로부터 구입 한 데이터가 포함됩니다.
내부 데이터 소스에는 고객 구매와 같은 거래 데이터
등록 양식의 사용자 입력 정보와 같은 고객 프로필
-
고객이
-
Clickstream 데이터에 응답했는지 여부 등 캠페인 내역 960> 전자 메일, 채팅, 설문 조사 및 고객 서비스 요청 등의 고객 상호 작용
-
텔레매틱스, 센서 및 스마트 미터기와 같은 기계 생성 데이터
-
외부 데이터 소스에는 Facebook, Twitter 및 LinkedIn과 같은
-
소셜 미디어가 포함됩니다.
-
Bloomberg, Thompson Reuters, Esri 및 Westlaw와 같은 구독 서비스
예측에 여러 이종 데이터 소스의 데이터를 결합하여 모델을 사용하면 고객의 전체적인 시각을보다 정확하게 파악할 수 있으므로보다 정확한 모델을 얻을 수 있습니다.
-
예측 분석을 사용할 때 성공 보장
-
예측 분석은 데이터로 강화 된 밝은 전구라고 생각하십시오. 예측 분석 기술의 통찰력은 전략의 역량을 강화하고 운영을 간소화하며 수익을 향상시킵니다. 다음 네 가지 권장 사항은 예측 분석 이니셔티브의 성공을 보장하는 데 도움이 될 수 있습니다.
변화의 문화 조성
예측 분석은 조직 전반에 걸쳐 채택되어야합니다. 조직은 변화를 수용해야합니다. 비즈니스 이해 관계자는 권장 사항을 통합하고 예측 분석 프로젝트에서 파생 된 결과를 채택 할 준비가되어 있어야합니다. 예측 분석 프로젝트의 결과는 비즈니스 리더가 기꺼이 조치를 취하는 경우에만 유용합니다.
데이터 과학 팀 만들기
예측 분석 솔루션을 구축하고 지원하는 것이 유일한 업무 인 데이터 과학 팀을 고용하십시오. 비즈니스 분석가, 데이터 과학자 및 정보 기술자로 구성된 재능있는 전문가 팀이 전임 프로젝트에서보다 효과적으로 작업 할 수 있습니다. 전문적인 배경을 포함하면 다른 영역의 팀에게 중요한 통찰력을 줄 수 있습니다. 조직의 여러 부서에서 팀 구성원을 선택하면 광범위한 구매를 보장 할 수 있습니다.
효과적으로 시각화 도구 사용
시각화는 복잡한 아이디어를 효율적으로 전달하는 강력한 방법입니다. 효과적으로 시각화를 사용하면 작업중인 데이터를 처음에 탐색하고 이해하는 데 도움이됩니다.차트와 같은 시각 자료도 모델의 산출물을 평가하거나 예측 모델의 성능을 비교하는 데 도움이 될 수 있습니다.
예측 분석 도구 사용