데이터 마이닝 - 더미 (Dummy)

데이터 마이닝의 특징 OLAP과 같은 쿼리,보고와 비교할 때 특정 질문을하지 않아도 정보를 얻을 수 있다는 것입니다.

데이터 마이닝은 비즈니스 인텔리전스 업무에서 두 가지 주요 역할을 담당합니다.

"일어날 수있는 일을 알려주십시오"역할: 데이터 마이닝의 첫 번째 역할은 예측 적입니다. 일어날 수 있습니다. "숨겨진 지식을 데이터웨어 하우스에 잠궈 놓으면 미래의 추세와 발생 가능성 및 확률이 공개되어 사용자에게 제공됩니다.
가능한 미래의 이벤트 및 발생 외에도 데이터 마이닝은 특히 알아 두어야 할 흥미로운 정보를 추출하려고 시도합니다. 특히 서로 다른 두 제품의 판매 간 비정상적인 관계와 소매점의 배치에 따라 그 관계가 어떻게 다른지에 대한 정보를 제공합니다. 이러한 재미있는 가벼운 음식들이 많이 있지만, 쿼리 또는 OLAP 도구를 사용하는 경우 어떤 질문을하고 결과를 해석 할 수 있습니까? 데이터 마이닝은 어려운 작업을 수행하여 묻는 질문을 파악하는 까다로운 작업을 도와줍니다.

데이터 마이닝은 특히 다음과 같은 특정 비즈니스 미션 유형에 적합합니다.

사기 탐지

마케팅 프로그램 효율성 결정

대규모 고객 기반 또는 일반 인구의 경우 마케팅 프로그램의 일환으로 타겟팅해야합니다.
고객 유지 임무를 포함하여 고객 라이프 사이클 관리
고급 비즈니스 프로세스 모델링 및 가상 시나리오 수행
앞 목록의 각 비즈니스 임무의 배경에 대해 생각해보십시오.
많은 양의 데이터

다양한 데이터 조합의 수

복잡한 알고리즘 및 고급 통계 기법을 포함하는 집중적 인 결과 집합 분석
이제 이러한 임무를 수행하기 위해보고 또는 OLAP 도구를 사용하는 경우 수행해야 할 작업에 대해 생각해보십시오.. 질문을하고 결과를 얻고, 다른 질문을하고 또 다른 결과를 얻은 다음, 그 단계를 반복해야한다면 위의 임무를 철저히 수행하는 것이 사실상 불가능하다는 것을 알 수 있습니다.
데이터 마이닝 및 인공 지능

10 년 이상 정보 기술 (IT) 분야에 종사해온 경험이 있다면 앞의 용어 중 일부는 막연하게 익숙 할 것입니다.숨겨진 지식의 잠금을 해제 하시겠습니까? 예측 기능? 잠깐 - 인공 지능입니다!

상업적 컴퓨팅의 초기부터 많은 양의 데이터를 처리하고 그 분석을 기반으로 의사 결정을 내릴 수있는 "사고 기계"를 개발하는 데 엄청난 관심이있었습니다. 인공 지능 (AI)에 대한 관심은 1980 년대 중반에 정점에 도달했습니다. 당시 데이터베이스 공급 업체는 지식 기반 관리 시스템 (knowledge base management systems, KBMS)을 생산하기 위해 노력했습니다. 다른 벤더들은 forward chaining 및 backward-chaining과 같은 기술을 사용하여 사용자에게 의사 결정을 조언하는

전문가 시스템 쉘, 또는 AI 기반 응용 프로그램 개발 프레임 워크를 제공했습니다. 신경 네트워크는 차세대 인공 지능 개발로 자리 잡았습니다. 90 년대 초, 기대치가 클라이언트 / 서버 마이그레이션 및 데이터웨어 하우징과 같은 다른 기능을 능가하는 AI가 주요 단계로 접어 들면서 AI에 대한 관심이 줄어 들었습니다.

이제 인공 지능이 돌아 왔습니다! 데이터 마이닝에 사용되는 최고 프로파일 인공 지능 기법은 신경망입니다. 신경망은 원래 인간의 뇌가 문제를 해결하는 방식을 모방하는 처리 모델로 계획되었으며, 뉴런과 고도의 병렬 처리를 통해 패턴 해결을 수행했습니다. 데이터 마이닝이 처리하는 비즈니스 인텔리전스 영역에 신경 네트워크 알고리즘을 적용하면 (다시 한 번 예측하고 "흥미로운 것을 말해주십시오") 자연스럽게 일치하는 것으로 보입니다.

데이터 마이닝 / 신경망 게임은 확실히 조사할만한 가치가 있지만주의 깊게 조사해야합니다. 알고리즘을 이해하지 못하는 사람들이 손쉽게 실패 할 수있는 흥미롭고 흥미로운 기술을 많이 찾을 수 있습니다.

그러나 적절한 지식과 교육을 통해 OLAP 중심 비즈니스 분석을위한 기술 분석 쌍으로 비즈니스 인텔리전스 프레임 워크에 이러한 유형의 처리를 가져 오기 위해 본격적인 노력을 기울일 수 있습니다.

데이터 마이닝 및 통계

데이터 마이닝의보다 성숙한 영역은 데이터웨어 하우스의 대용량 데이터에 대해 고급 통계 기법을 적용하는 것입니다. 서로 다른 도구는 서로 다른 유형의 통계 기술을 사용하여 해결하려는 특정 영역에 맞 춥니 다.

통계적 배경이 없으면 많은 데이터 마이닝이 혼란 스러울 수 있습니다. 알고리즘을 학습하고 더 큰 데이터 세트로 올바른 결과를 보장하는 규칙을 작성하려면 많은 작업이 필요합니다. 그러나 당신이이 개념에 익숙하거나 도움을 줄 수있는 동료가 있다고 가정하면 다음과 같이보다 광범위하게 활용되는 알고리즘을 사용할 수 있습니다:

분류 알고리즘:

하나 이상의 이산 변수를 다른 것 데이터 세트의 속성. 분류 알고리즘을 사용하여 데이터 마이닝 도구는 많은 양의 데이터를 살펴보고 "예를 들어 두 세대 이상의 제품 구매를 통해 유지되는 고객은 다음과 같은 특성을 갖는 경향이 있습니다. 최소 $ 75, 000, 그리고 그들은 자신의 집을 소유하고 있습니다."

회귀 알고리즘:

데이터 집합의 다른 속성을 기반으로 한 이익 또는 손실과 같은 하나 이상의 연속 변수를 예측합니다. 회귀 알고리즘은 "시간 경과에 따른 데이터 마이닝 도구"에 제공된 히스토리 정보를 통해 구동되며

시계열 정보로 잘 알려져 있습니다. 분할 알고리즘:
유사한 속성을 가진 항목의 그룹 또는 클러스터로 데이터를 나눕니다. 연관 알고리즘: 데이터 집합의 여러 속성 간의 상관 관계를 찾습니다. 이러한 종류의 알고리즘의 가장 보편적 인 적용은 시장 바구니 분석에서 사용할 수있는 연결 규칙을 만듭니다. 예를 들어, 고객이 특정 소프트웨어 패키지를 구매할 경우 2 주 이내에 제품 별 추가 팩 2 개 이상을 65 % 구매할 수 있습니다. 시퀀스 분석 알고리즘:
웹 경로 흐름과 같은 데이터에서 빈번한 시퀀스 또는 에피소드를 요약합니다. 더 많은 방법이 존재합니다. 그 오래된 통계 책을 털어 내고 독서를 시작하십시오.