개인 재정 예측 시스템 분석의 데이터 한계

예측 시스템 분석의 데이터 한계

비디오: 리비젼_해외빅데이터심층해부 세미나 기획 브리핑20141114_전용준 2024

비디오: 리비젼_해외빅데이터심층해부 세미나 기획 브리핑20141114_전용준 2024
Anonim

비즈니스 시스템의 여러 측면과 마찬가지로 데이터는 인간의 창조물이므로 데이터를 처음 사용할 때 유용성에 약간의 제한이 있습니다 그것을 얻으십시오. 다음은 발생할 수있는 몇 가지 제한 사항의 개요입니다.

  • 데이터가 불완전 할 수 있습니다. 누락 된 값은 섹션이나 데이터의 상당 부분이 없더라도 사용성을 제한 할 수 있습니다.

    예를 들어, 모델링하려는 대형 세트 중 하나 또는 두 가지 조건 만 포함 할 수 있습니다. 예를 들어 주식 시장 성과 분석을 위해 만들어진 모델에 지난 5 년 동안 사용 가능한 데이터 만있는 경우 두 가지 모두 왜곡됩니다 강세장을 가정 한 데이터와 모델.

    데이터의 자연 변동에 대한 완전한 그림을 제공하는 일정을 확인하십시오. 귀하의 데이터는

    계절성 에 의해 제한되어서는 안됩니다. 설문 조사 데이터를 사용하는 경우 사람들이 항상 정확한 정보를 제공하지는 않습니다.

  • 모든 사람들이 일주일에 운동 횟수 또는 음주량을 정직하게 말할 수있는 것은 아닙니다. 사람들은 자의식만큼이나 부정직하지 않을 수도 있지만 데이터는 여전히 비뚤어집니다.

    여러 출처에서 수집 한 데이터의 품질과 형식이 다를 수 있습니다. 조사, 전자 메일, 데이터 입력 양식 및 회사 웹 사이트와 같은 다양한 출처에서 수집 된 데이터는 서로 다른 특성 및 구조를 갖습니다. 다양한 소스의 데이터는 데이터 필드간에 많은 호환성이 없을 수 있습니다. 이러한 데이터는 분석 준비가되기 전에 주요 사전 처리가 필요합니다. 함께 제공되는 사이드 바는 예제를 제공합니다.
  • 여러 출처에서 수집 된 데이터는 병합 된 데이터 필드간에 서식, 레코드 중복 및 불일치가 다를 수 있습니다. 이러한 데이터를 오랜 시간 동안 청소하고 신뢰성을 검증하는 데 더 오래 걸릴 것으로 예상하십시오.

    데이터의 한계를 확인하려면 다음을 수행하십시오.

모델에서 사용할 모든 변수를 확인하십시오.

특히 시간이 지남에 따라 데이터의 범위를 평가하면 모델이 계절성 함정을 피할 수 있습니다.

  • 누락 된 값을 확인하고, 누락 된 값을 확인하고, 전체 분석에 미치는 영향을 평가합니다.

  • 극단 값 (이상치)을주의 깊게 살펴보고 분석에 포함할지 여부를 결정하십시오.

  • 교육 및 테스트 데이터 풀이 충분히 큰지 확인하십시오.

  • 데이터 유형

  • (정수, 소수점 값 또는 문자 등)이 올바른지 확인하고 가능한 값의 상한 및 하한을 설정하십시오. 데이터가 여러 출처에서 온 경우 데이터 통합에 특히주의하십시오. 데이터 소스와 데이터의 전반적인 품질에 미치는 영향을 이해해야합니다.

  • 전체 인구를 대표하는 관련 데이터 세트를 선택합니다.

분석에 적합한 매개 변수를 선택하십시오.

  • 이러한주의와 관심을 끈 후에도 정확하게 분석하기 전에 데이터에 사전 처리가 필요한 경우 놀라지 마십시오. 전처리는 원래 데이터와 관련된 몇 가지 문제를 처리해야하기 때문에 오랜 시간과 상당한 노력이 필요합니다. 이러한 문제는 다음과 같습니다.

  • 데이터에서 누락 된 값.

데이터에 존재하는 불일치 및 / 또는 오류.

  • 데이터의 중복 또는 이상 값.

  • 데이터의 정규화 또는 기타 변형.

  • 분석에 필요한 파생 데이터.

예측 시스템 분석의 데이터 한계

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...