개인 재정 데이터 마이너가 수행하는 것 - 더미

데이터 마이너가 수행하는 것 - 더미

차례:

비디오: 빅데이터 002 빅데이터 처리 시스템 목표 2024

비디오: 빅데이터 002 빅데이터 처리 시스템 목표 2024
Anonim

데이터를 원료로 생각하고 데이터에서 유익하고 상대적으로 세련된 정보를 얻을 수 있다면 정보를 추출하는 프로세스는 광석이나 보석에서 금속을 흙으로 추출하는 것과 비교하면 이것이 데이터 마이닝 이라는 용어의 유래입니다.

데이터 마이닝 비즈니스에 중점을두기

데이터 마이너는 데이터를 아무렇게나 숙고하지 않고 흥미로운 것을 찾기를 바랍니다. 모든 데이터 마이닝 프로젝트는 특정 비즈니스 문제와 일치하는 목표로 시작됩니다.

데이터 광부로서는 최종 결정을 내릴 권한이 없으므로 의사 결정권자의 요구에 맞게 작업을 수행하는 것이 중요합니다. 문제, 필요 및 기본 설정을 이해하고 올바른 비즈니스 결정을 지원하는 정보를 제공하는 데 집중해야합니다.

당신의 사업 지식은 매우 중요합니다. 경영진은 일하는 동안 옆에 앉아서 자신의 발견과 관련성에 대한 피드백을 제공하지 않을 것입니다. 자신의 경험과 통찰력을 바탕으로 일하는 동안 스스로 판단해야합니다.

하루 종일 데이터 마이너가 삶의 변화를 발견하고 귀중한 모델을 만들고 일상적인 업무에 통합 할 수 있다면 좋을 것입니다. 그러나 운동 선수가 하루 종일 우승을 차지할 수 있다면 좋을 것이라고 말하는 것과 같습니다. 승리의 순간에 도달하기 위해서는 많은 준비가 필요합니다. 따라서 운동 선수와 마찬가지로 데이터 광부는 준비에 많은 시간을 소비합니다.

좋은 작업 프로세스는 시간, 데이터 및 기타 모든 리소스를 최대한 활용할 수 있도록 도와줍니다. 이 책에서는 가장 널리 사용되는 데이터 마이닝 프로세스 인 CRISP-DM을 소개합니다. 이것은 여러 산업계의 데이터 광업 협회 컨소시엄이 만든 6 단계의 발견 및 조치이며 누구나 사용할 수있는 공개 표준입니다.

CRISP-DM 프로세스의 단계는

비즈니스 이해

데이터 이해

  1. 데이터 준비

  2. 모델링

  3. 평가

  4. 배포 (일상 비즈니스 모델 사용)

  5. 단계는 사업의 결과와 가치의 질에 중요한 비중을두고 있습니다. 그러나 필요한 시간면에서 데이터 준비가 우세합니다. 데이터 준비 작업은 데이터 마이닝 프로세스의 다른 모든 단계보다 결합하는 데 더 많은 시간이 걸립니다.

  6. 모델 만들기

목표를 이해하고 데이터를 정리하여 사용할 준비가되면 예측 모델을 작성하는 데 집중할 수 있습니다.모델은 보고서가 할 수없는 것을 수행합니다. 그들은 행동을 지원하는 정보를 제공합니다.

판매량이 감소했다고 보고서에서 확인할 수 있습니다. 지역, 제품 및 채널별로 판매가 중단 될 수 있으므로 매출이 감소한 곳과 이러한 감소가 특정 지역에만 광범위하게 영향을 미치는지 여부를 파악할 수 있습니다. 그러나 그들은 왜

판매가 거절되었는지, 어떤 행동이 사업을 되살리는 데 도움이되는지에 대한 단서를주지 않습니다.

모델은 판매에 영향을 미치는 요인, 매출을 증가 또는 감소시키는 행동, 비즈니스를 원활하게 운영하는 전략 및 전술을 이해하는 데 도움이됩니다. 흥미 롭군요, 그렇죠? 대부분의 데이터 마이너가 모델링을 작업의 재미있는 부분으로 생각하는 이유 일 수 있습니다. 수학적 모델의 이해 수학적 모델은 데이터 마이닝의 핵심이지만 그 모델은 무엇입니까? 그들은 무엇을하고, 어떻게 일하고, 어떻게 창조됩니까? 수학적 모델은 평범하고 단순한 방정식 또는 방정식 집합으로 둘 이상의 것 사이의 관계를 설명합니다. 그러한 방정식은 자연과 사회의 작용에 관한 이론에 속한다. 이 이론은 실질적인 증거에 의해 뒷받침 될 수도 있고 아니면 단지 야생 추측 일 수도 있습니다. 수학의 언어는 두 경우 모두 같습니다.

예측 모델, 통계 모델,

또는

선형 모델

과 같은 용어는 특정 유형의 수학적 모델, 의도 한 용도, 형식 또는 파생 방법을 반영하는 이름을 의미합니다 특정 모델. 이 세 가지 예는 많은 용어 중 일부에 지나지 않습니다.

비즈니스 환경에서 모델을 언급하면 ​​예측을하는 데 사용되는 모델 일 가능성이 큽니다. 모델은 다른 많은 것들 중에서 주가, 제품 판매 및 실업률을 예측하는 데 사용됩니다. 이러한 예측은 정확할 수도 정확하지 않을 수도 있지만, 모델에 포함 된 주어진 값 집합 (이 같은 알려진 요인을 독립 변수 또는 입력

이라고 함)에 대해 잘 정의 된 예측 (종속 변수, 출력, 또는 결과 라고도 함)을 찾습니다. 수학적 모델은 특정 프로세스를 주도하는 작업 메커니즘을 설명하는 등 비즈니스에서 다른 목적으로 사용됩니다. 데이터 마이닝에서는 기계 학습 또는 통계 방법을 사용하여 데이터의 패턴을 찾아 모델을 만듭니다. 데이터 광부는 고전 통계 학자와 동일한 엄격한 접근법을 따르지 않지만 모든 모델은 실제 데이터 및 일관된 수학적 모델링 기법에서 파생됩니다. 모든 데이터 마이닝 모델은 일련의 증거에 의해 지원됩니다. 왜 수학 모델을 사용합니까? 단어를 사용하여 동일한 관계를 기술 할 수는 없습니까? 그것은 가능하지만, 방정식을 사용할 때 어떤 이점이 있습니다. 편의성: 문장에서 작성된 동등한 설명과 비교하여 방정식은 간략합니다. 수학적 상징주의는 수학적 관계를 표현할 목적으로 특별히 발전해 왔습니다. 영어와 같은 언어는 그렇지 않습니다. Clarity:

수식은 아이디어를 간결하게 전달하고 모호하지 않습니다.그것들은 문화에 기초한 다른 해석의 대상이 아니며, 수학의 상징주의는 전 세계적으로 널리 사용되는 일종의 공통 언어입니다.

일관성:

  • 수학적 표현은 모호하지 않기 때문에 특정 상황의 의미는 수학적 모델에 의해 명확하게 정의됩니다. 정보를 실천하기

  • 모델은 비즈니스에서 사용할 때만 가치를 제공합니다. 모델의 예측은 의사 결정을 다양한 방식으로 지원할 수 있습니다. 특정 결정을 내릴 때 사용할 보고서 나 프레젠테이션에 예측을 포함시킬 수 있습니다.

  • 모델을 운영 시스템 (예: 고객 서비스 시스템)에 통합하여 일상적인 사용에 대한 실시간 예측을 제공합니다. (예를 들어, 즉각적인 지불, 즉각적인 거부 또는 추가 조사를 위해 보험금 청구를 표시 할 수 있습니다.) 배치 예측에 모델을 사용합니다. 예를 들어 사내 고객 목록에 점수를 매겨 특정 고객을 받아야하는 고객을 결정할 수 있습니다.

데이터 마이너가 수행하는 것 - 더미

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...