비디오: 데이터 분석_시계열분석(1강)_도입 (PS-Lab : 송인식) 2024
예측 분석 모델에서 다양한 통계, 데이터 마이닝 및 기계 학습 알고리즘을 사용할 수 있습니다. 모델의 목표를 정의하고 작업 할 데이터를 선택한 후에는 알고리즘을 선택하는 것이 더 좋습니다.
이러한 알고리즘 중 일부는 특정 비즈니스 문제를 해결하고 기존 알고리즘을 향상 시키며 새로운 기능을 제공하기 위해 개발 되었기 때문에 일부 기능이 다른 기능보다 귀하의 목적에 더 적합하게 만들 수 있습니다. 다음과 같은 비즈니스 문제를 해결하기 위해 다양한 알고리즘 중에서 선택할 수 있습니다.
-
예를 들어, 사회 영역에서의 고객 세분화 및 / 또는 커뮤니티 검색의 경우 클러스터링 알고리즘이 필요합니다.
-
고객 유지 또는 추천 시스템을 개발하려면 분류 알고리즘을 사용해야합니다.
-
신용 평가 또는 시간 주도 이벤트의 다음 결과 예측을 위해 회귀 알고리즘을 사용합니다.
시간과 자원이 허용하는 한, 가능한 한 많은 알고리즘을 적절한 유형으로 실행해야합니다. 서로 다른 알고리즘의 실행을 비교하면 데이터에 포함 된 비즈니스 인텔리전스 또는 데이터에 대한 놀라운 결과를 얻을 수 있습니다. 이렇게하면 비즈니스 문제에 대한보다 자세한 통찰력을 얻을 수 있으며 데이터 내에서 예측력이있는 변수를 식별하는 데 도움이됩니다.
앙상블 모델, 모델 그룹을 구축하여 가장 잘 성공합니다. 앙상블 모델은 사전 정의 된 메커니즘을 사용하여 모든 구성 요소 모델에서 결과를 수집하고 사용자에게 최종 결과를 제공합니다. 모델은 쿼리, 시나리오 모음, 의사 결정 트리 또는 고급 수학 분석과 같은 다양한 형태를 취할 수 있습니다. 또한 특정 모델은 특정 데이터 및 분석에 가장 적합합니다. 의사 결정 규칙을 사용하여 주어진 시나리오 나 트랜잭션의 결과를 결정하는 분류 알고리즘을 사용할 수 있습니다 (예:고객이 마케팅 캠페인에 응답 할 가능성이 있습니까?
이 송금은 돈세탁 계획의 일부가 될 가능성이 있습니까?-
이 대출 신청자가 대출 채무 불이행 가능성이 있습니까?
-
감독되지 않는 클러스터링 알고리즘을 사용하여 데이터 세트에 존재하는 관계를 찾을 수 있습니다. 이 알고리즘을 사용하여 고객간에 서로 다른 그룹을 찾고, 함께 그룹화 할 수있는 서비스를 결정하거나, 어떤 제품을 업 그레 이드 할 수 있는지 등을 결정할 수 있습니다.회귀 알고리즘은 과거 가격을 고려한 주식 움직임 추세 예측과 같은 지속적인 데이터를 예측하는 데 사용할 수 있습니다.
-
알고리즘을 선택할 때 데이터 및 비즈니스 목표 만 고려하는 요소는 아닙니다. 데이터 과학자의 전문 지식은이 시점에서 엄청난 가치가 있습니다. 작업을 완료 할 수있는 알고리즘을 선택하는 것은 종종 과학과 예술의 까다로운 조합입니다.
예술 분야는 비즈니스 영역에서의 경험과 숙련도에서 비롯되며 비즈니스 목표를 정확하게 수행 할 수있는 모델을 식별하는 데 중요한 역할을합니다.