차례:
- 데이터 마이닝 비즈니스에 중점을두기
- 하루 종일 데이터 마이너가 삶의 변화를 발견하고 귀중한 모델을 만들고 일상적인 업무에 통합 할 수 있다면 좋을 것입니다. 그러나 운동 선수가 하루 종일 우승을 차지할 수 있다면 좋을 것이라고 말하는 것과 같습니다. 승리의 순간에 도달하기 위해서는 많은 준비가 필요합니다. 따라서 운동 선수와 마찬가지로 데이터 광부는 준비에 많은 시간을 소비합니다.
- CRISP-DM 프로세스의 단계는
- 판매량이 감소했다고 보고서에서 확인할 수 있습니다. 지역, 제품 및 채널별로 판매가 중단 될 수 있으므로 매출이 감소한 곳과 이러한 감소가 특정 지역에만 광범위하게 영향을 미치는지 여부를 파악할 수 있습니다. 그러나 그들은 왜
- 또는
비디오: 빅데이터 002 빅데이터 처리 시스템 목표 2025
데이터를 원료로 생각하고 데이터에서 유익하고 상대적으로 세련된 정보를 얻을 수 있다면 정보를 추출하는 프로세스는 광석이나 보석에서 금속을 흙으로 추출하는 것과 비교하면 이것이 데이터 마이닝 이라는 용어의 유래입니다.
데이터 마이닝 비즈니스에 중점을두기
데이터 마이너는 데이터를 아무렇게나 숙고하지 않고 흥미로운 것을 찾기를 바랍니다. 모든 데이터 마이닝 프로젝트는 특정 비즈니스 문제와 일치하는 목표로 시작됩니다.
데이터 광부로서는 최종 결정을 내릴 권한이 없으므로 의사 결정권자의 요구에 맞게 작업을 수행하는 것이 중요합니다. 문제, 필요 및 기본 설정을 이해하고 올바른 비즈니스 결정을 지원하는 정보를 제공하는 데 집중해야합니다.
당신의 사업 지식은 매우 중요합니다. 경영진은 일하는 동안 옆에 앉아서 자신의 발견과 관련성에 대한 피드백을 제공하지 않을 것입니다. 자신의 경험과 통찰력을 바탕으로 일하는 동안 스스로 판단해야합니다.
하루 종일 데이터 마이너가 삶의 변화를 발견하고 귀중한 모델을 만들고 일상적인 업무에 통합 할 수 있다면 좋을 것입니다. 그러나 운동 선수가 하루 종일 우승을 차지할 수 있다면 좋을 것이라고 말하는 것과 같습니다. 승리의 순간에 도달하기 위해서는 많은 준비가 필요합니다. 따라서 운동 선수와 마찬가지로 데이터 광부는 준비에 많은 시간을 소비합니다.
좋은 작업 프로세스는 시간, 데이터 및 기타 모든 리소스를 최대한 활용할 수 있도록 도와줍니다. 이 책에서는 가장 널리 사용되는 데이터 마이닝 프로세스 인 CRISP-DM을 소개합니다. 이것은 여러 산업계의 데이터 광업 협회 컨소시엄이 만든 6 단계의 발견 및 조치이며 누구나 사용할 수있는 공개 표준입니다.
CRISP-DM 프로세스의 단계는
비즈니스 이해
데이터 이해
-
데이터 준비
-
모델링
-
평가
-
배포 (일상 비즈니스 모델 사용)
-
단계는 사업의 결과와 가치의 질에 중요한 비중을두고 있습니다. 그러나 필요한 시간면에서 데이터 준비가 우세합니다. 데이터 준비 작업은 데이터 마이닝 프로세스의 다른 모든 단계보다 결합하는 데 더 많은 시간이 걸립니다.
-
모델 만들기
목표를 이해하고 데이터를 정리하여 사용할 준비가되면 예측 모델을 작성하는 데 집중할 수 있습니다.모델은 보고서가 할 수없는 것을 수행합니다. 그들은 행동을 지원하는 정보를 제공합니다.
판매량이 감소했다고 보고서에서 확인할 수 있습니다. 지역, 제품 및 채널별로 판매가 중단 될 수 있으므로 매출이 감소한 곳과 이러한 감소가 특정 지역에만 광범위하게 영향을 미치는지 여부를 파악할 수 있습니다. 그러나 그들은 왜
판매가 거절되었는지, 어떤 행동이 사업을 되살리는 데 도움이되는지에 대한 단서를주지 않습니다.
모델은 판매에 영향을 미치는 요인, 매출을 증가 또는 감소시키는 행동, 비즈니스를 원활하게 운영하는 전략 및 전술을 이해하는 데 도움이됩니다. 흥미 롭군요, 그렇죠? 대부분의 데이터 마이너가 모델링을 작업의 재미있는 부분으로 생각하는 이유 일 수 있습니다. 수학적 모델의 이해 수학적 모델은 데이터 마이닝의 핵심이지만 그 모델은 무엇입니까? 그들은 무엇을하고, 어떻게 일하고, 어떻게 창조됩니까? 수학적 모델은 평범하고 단순한 방정식 또는 방정식 집합으로 둘 이상의 것 사이의 관계를 설명합니다. 그러한 방정식은 자연과 사회의 작용에 관한 이론에 속한다. 이 이론은 실질적인 증거에 의해 뒷받침 될 수도 있고 아니면 단지 야생 추측 일 수도 있습니다. 수학의 언어는 두 경우 모두 같습니다.
예측 모델, 통계 모델,
또는
선형 모델
과 같은 용어는 특정 유형의 수학적 모델, 의도 한 용도, 형식 또는 파생 방법을 반영하는 이름을 의미합니다 특정 모델. 이 세 가지 예는 많은 용어 중 일부에 지나지 않습니다.
비즈니스 환경에서 모델을 언급하면 예측을하는 데 사용되는 모델 일 가능성이 큽니다. 모델은 다른 많은 것들 중에서 주가, 제품 판매 및 실업률을 예측하는 데 사용됩니다. 이러한 예측은 정확할 수도 정확하지 않을 수도 있지만, 모델에 포함 된 주어진 값 집합 (이 같은 알려진 요인을 독립 변수 또는 입력
이라고 함)에 대해 잘 정의 된 예측 (종속 변수, 출력, 또는 결과 라고도 함)을 찾습니다. 수학적 모델은 특정 프로세스를 주도하는 작업 메커니즘을 설명하는 등 비즈니스에서 다른 목적으로 사용됩니다. 데이터 마이닝에서는 기계 학습 또는 통계 방법을 사용하여 데이터의 패턴을 찾아 모델을 만듭니다. 데이터 광부는 고전 통계 학자와 동일한 엄격한 접근법을 따르지 않지만 모든 모델은 실제 데이터 및 일관된 수학적 모델링 기법에서 파생됩니다. 모든 데이터 마이닝 모델은 일련의 증거에 의해 지원됩니다. 왜 수학 모델을 사용합니까? 단어를 사용하여 동일한 관계를 기술 할 수는 없습니까? 그것은 가능하지만, 방정식을 사용할 때 어떤 이점이 있습니다. 편의성: 문장에서 작성된 동등한 설명과 비교하여 방정식은 간략합니다. 수학적 상징주의는 수학적 관계를 표현할 목적으로 특별히 발전해 왔습니다. 영어와 같은 언어는 그렇지 않습니다. Clarity:
수식은 아이디어를 간결하게 전달하고 모호하지 않습니다.그것들은 문화에 기초한 다른 해석의 대상이 아니며, 수학의 상징주의는 전 세계적으로 널리 사용되는 일종의 공통 언어입니다.
일관성:
-
수학적 표현은 모호하지 않기 때문에 특정 상황의 의미는 수학적 모델에 의해 명확하게 정의됩니다. 정보를 실천하기
-
모델은 비즈니스에서 사용할 때만 가치를 제공합니다. 모델의 예측은 의사 결정을 다양한 방식으로 지원할 수 있습니다. 특정 결정을 내릴 때 사용할 보고서 나 프레젠테이션에 예측을 포함시킬 수 있습니다.
-
모델을 운영 시스템 (예: 고객 서비스 시스템)에 통합하여 일상적인 사용에 대한 실시간 예측을 제공합니다. (예를 들어, 즉각적인 지불, 즉각적인 거부 또는 추가 조사를 위해 보험금 청구를 표시 할 수 있습니다.) 배치 예측에 모델을 사용합니다. 예를 들어 사내 고객 목록에 점수를 매겨 특정 고객을 받아야하는 고객을 결정할 수 있습니다.
