개인 재정 예측 시스템 분석의 데이터 한계

예측 시스템 분석의 데이터 한계

비디오: 리비젼_해외빅데이터심층해부 세미나 기획 브리핑20141114_전용준 2024

비디오: 리비젼_해외빅데이터심층해부 세미나 기획 브리핑20141114_전용준 2024
Anonim

비즈니스 시스템의 여러 측면과 마찬가지로 데이터는 인간의 창조물이므로 데이터를 처음 사용할 때 유용성에 약간의 제한이 있습니다 그것을 얻으십시오. 다음은 발생할 수있는 몇 가지 제한 사항의 개요입니다.

  • 데이터가 불완전 할 수 있습니다. 누락 된 값은 섹션이나 데이터의 상당 부분이 없더라도 사용성을 제한 할 수 있습니다.

    예를 들어, 모델링하려는 대형 세트 중 하나 또는 두 가지 조건 만 포함 할 수 있습니다. 예를 들어 주식 시장 성과 분석을 위해 만들어진 모델에 지난 5 년 동안 사용 가능한 데이터 만있는 경우 두 가지 모두 왜곡됩니다 강세장을 가정 한 데이터와 모델.

    데이터의 자연 변동에 대한 완전한 그림을 제공하는 일정을 확인하십시오. 귀하의 데이터는

    계절성 에 의해 제한되어서는 안됩니다. 설문 조사 데이터를 사용하는 경우 사람들이 항상 정확한 정보를 제공하지는 않습니다.

  • 모든 사람들이 일주일에 운동 횟수 또는 음주량을 정직하게 말할 수있는 것은 아닙니다. 사람들은 자의식만큼이나 부정직하지 않을 수도 있지만 데이터는 여전히 비뚤어집니다.

    여러 출처에서 수집 한 데이터의 품질과 형식이 다를 수 있습니다. 조사, 전자 메일, 데이터 입력 양식 및 회사 웹 사이트와 같은 다양한 출처에서 수집 된 데이터는 서로 다른 특성 및 구조를 갖습니다. 다양한 소스의 데이터는 데이터 필드간에 많은 호환성이 없을 수 있습니다. 이러한 데이터는 분석 준비가되기 전에 주요 사전 처리가 필요합니다. 함께 제공되는 사이드 바는 예제를 제공합니다.
  • 여러 출처에서 수집 된 데이터는 병합 된 데이터 필드간에 서식, 레코드 중복 및 불일치가 다를 수 있습니다. 이러한 데이터를 오랜 시간 동안 청소하고 신뢰성을 검증하는 데 더 오래 걸릴 것으로 예상하십시오.

    데이터의 한계를 확인하려면 다음을 수행하십시오.

모델에서 사용할 모든 변수를 확인하십시오.

특히 시간이 지남에 따라 데이터의 범위를 평가하면 모델이 계절성 함정을 피할 수 있습니다.

  • 누락 된 값을 확인하고, 누락 된 값을 확인하고, 전체 분석에 미치는 영향을 평가합니다.

  • 극단 값 (이상치)을주의 깊게 살펴보고 분석에 포함할지 여부를 결정하십시오.

  • 교육 및 테스트 데이터 풀이 충분히 큰지 확인하십시오.

  • 데이터 유형

  • (정수, 소수점 값 또는 문자 등)이 올바른지 확인하고 가능한 값의 상한 및 하한을 설정하십시오. 데이터가 여러 출처에서 온 경우 데이터 통합에 특히주의하십시오. 데이터 소스와 데이터의 전반적인 품질에 미치는 영향을 이해해야합니다.

  • 전체 인구를 대표하는 관련 데이터 세트를 선택합니다.

분석에 적합한 매개 변수를 선택하십시오.

  • 이러한주의와 관심을 끈 후에도 정확하게 분석하기 전에 데이터에 사전 처리가 필요한 경우 놀라지 마십시오. 전처리는 원래 데이터와 관련된 몇 가지 문제를 처리해야하기 때문에 오랜 시간과 상당한 노력이 필요합니다. 이러한 문제는 다음과 같습니다.

  • 데이터에서 누락 된 값.

데이터에 존재하는 불일치 및 / 또는 오류.

  • 데이터의 중복 또는 이상 값.

  • 데이터의 정규화 또는 기타 변형.

  • 분석에 필요한 파생 데이터.

예측 시스템 분석의 데이터 한계

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...