개인 재정 빅 데이터 용 마이닝 - 더미

빅 데이터 용 마이닝 - 더미

비디오: 1101.빅데이터와 데이터마이닝 이해1 2024

비디오: 1101.빅데이터와 데이터마이닝 이해1 2024
Anonim

데이터 마이닝은 대용량 데이터의 패턴을 찾기 위해 많은 양의 데이터를 탐색하고 분석하는 것을 포함합니다. 이 기술은 통계 및 인공 지능 (AI) 분야에서 나온 것으로, 데이터베이스 관리가 약간 혼재되어 있습니다.

일반적으로 데이터 마이닝의 목표는 분류 또는 예측입니다. 분류에서는 데이터를 그룹으로 정렬하는 것이 좋습니다. 예를 들어 마케팅 담당자는 응답 한 사람의 특성과 홍보에 응답하지 않은 사람의 특성에 관심이있을 수 있습니다.

두 클래스입니다. 예측에서 아이디어는 연속 변수의 값을 예측하는 것입니다. 예를 들어 마케팅 담당자는 프로모션에 응답 할 사람을 예측하는 데 관심이있을 수 있습니다. 데이터 마이닝에 사용되는 일반적인 알고리즘은 다음과 같습니다. 분류 트리:

하나 이상의 예측 변수의 측정을 기반으로 종속 카테고리 변수를 분류하는 데 사용되는 널리 사용되는 데이터 마이닝 기술입니다. 결과는 if-then 규칙을 형성하기 위해 읽을 수있는 노드 사이의 링크와 노드가있는 트리입니다.

  • 로지스틱 회귀:

    표준 회귀의 변형이지만 분류를 다루는 개념을 확장 한 통계 기법. 독립 변수의 함수로 발생 확률을 예측하는 공식을 생성합니다.
  • Neural networks: 동물 두뇌의 병렬 구조를 모델로 한 소프트웨어 알고리즘. 네트워크는 입력 노드, 숨겨진 레이어 및 출력 노드로 구성됩니다. 각 단위에는 가중치가 지정됩니다. 데이터는 입력 노드에 주어지며 시행 착오 체계에 의해 알고리즘은 특정 정지 기준을 충족 할 때까지 가중치를 조정합니다. 어떤 사람들은 이것을 블랙 박스 방식에 비유했습니다.

  • K- 가장 가까운 이웃과 같은 클러스터링 기술:

    유사한 레코드 그룹을 식별하는 기술. K- 가장 가까운 이웃 기술은 기록 (훈련) 데이터에서 기록과 점 사이의 거리를 계산합니다. 그런 다음이 레코드를 데이터 세트의 가장 가까운 이웃 클래스에 할당합니다.
  • 다음은 분류 트리 예제입니다. 전화 회사가 어떤 주거용 고객이 서비스를 중단 할 가능성이 있는지를 결정하려는 상황을 고려하십시오. 전화 회사는 다음과 같은 속성으로 구성된 정보를 가지고 있습니다. 서비스를받은 기간, 서비스에 소비 한 금액, 서비스가 문제가 있는지 여부, 그가 가장 필요로하는 전화 플랜이 있는지 여부, 다른 서비스를 번들로 묶어 놓았는지 여부, 다른 통신 사업자 계획에 관한 경쟁력있는 정보, 그리고 그가 서비스를 제공하고 있는지 여부 등이 포함됩니다.

물론, 이것보다 더 많은 속성을 찾을 수 있습니다. 마지막 속성은 결과 변수입니다. 이것이 소프트웨어가 고객을 두 그룹 중 하나로 분류하는 데 사용하는 것입니다 - 아마도 체류자 및 비행 위험이라고합니다.

데이터 세트는 학습 데이터와 테스트 데이터 세트로 나뉩니다. 훈련 데이터는 관찰 (속성이라고 함) 및 결과 변수 (분류 모델의 경우 2 진수) -이 경우 체류자 또는 비행 위험으로 구성됩니다.

알고리즘은 트레이닝 데이터를 통해 실행되며 일련의 규칙처럼 읽을 수있는 트리가 표시됩니다. 예를 들어, 고객이 10 년 이상 회사에 있었고 55 세 이상인 고객은 충성도가 높은 고객으로 남을 수 있습니다.

이 규칙은 테스트 데이터 세트를 통해 실행되어이 모델이 "새 데이터"에 얼마나 좋은지를 결정합니다. "모델에 대한 정확도 측정이 제공됩니다. 예를 들어, 널리 사용되는 기술은 혼동 행렬입니다. 이 행렬은 얼마나 많은 사례가 올바르게 분류 되었는가에 대한 정보를 제공하는 표입니다.

모델이 좋으면 사용 가능한 다른 데이터 (즉, 비행 위험의 새로운 경우를 예측하는 데 사용)로 전개 할 수 있습니다. 이 모델을 기반으로 회사는 예를 들어 비행 위험이라고 생각하는 고객에게 특별 제안을 보내도록 결정할 수 있습니다.

빅 데이터 용 마이닝 - 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...