개인 재정 누락 된 데이터 - 더미

누락 된 데이터 - 더미

차례:

비디오: 구글 애널리틱스 누락된 전자상거래 데이터 오류 메시지 해결 방법 2024

비디오: 구글 애널리틱스 누락된 전자상거래 데이터 오류 메시지 해결 방법 2024
Anonim

처리해야 할 가장 빈번하고 가장 혼란스러운 데이터 문제 중 하나는 누락 된 데이터입니다. 레코드가 삭제되었거나 저장 장치가 가득 차서 파일이 불완전 할 수 있습니다. 또는 일부 데이터 필드에는 일부 레코드에 대한 데이터가 없을 수 있습니다. 이러한 문제 중 첫 번째는 단순히 파일의 레코드 수를 확인하여 진단 할 수 있습니다. 두 번째 문제는 다루기가 더 어렵습니다.

누락 된 값이 들어있는 필드를 찾을 때 간단히 말하면

  • 무시하십시오.

  • 들판에 뭔가를 집어 넣으십시오.

문제 무시

경우에 따라 누락 된 값이 많은 단일 필드를 찾을 수도 있습니다. 그렇다면 가장 쉬운 방법은 필드를 무시하는 것입니다. 분석에 포함시키지 마십시오.

이 문제를 무시하는 또 다른 방법은 레코드를 무시하는 것입니다. 누락 된 데이터가 포함 된 레코드를 삭제하기 만하면됩니다. 불량 레코드가 몇 개만있는 경우에는 의미가 있습니다. 그러나 상당수의 누락 값을 포함하는 여러 데이터 필드가있는 경우이 방법을 사용하면 레코드 수를 허용 할 수없는 수준으로 줄일 수 있습니다.

일반적으로 레코드를 삭제하는 것은 누락 된 가치 문제에 대한 쉬운 방법이지만 이상적인 방법은 아닙니다. 문제가 상대적으로 적고 누락에 대한 식별 가능한 패턴이 없다면 문제의 레코드를 버리고 계속 진행할 수 있습니다. 그러나 빈번하게 더 높은 접근 방법이 보증됩니다.

누락 된 데이터 채우기

누락 된 데이터를 채우는 것은 해당 필드에 있었던 것에 대해 교양있는 추측을하게합니다. 이를 수행하는 좋은 방법과 나쁜 방법이 있습니다. 간단한 (그러나 나쁜) 접근법은 누락 된 값을 누락되지 않은 값의 평균으로 대체하는 것입니다. 숫자가 아닌 필드에서는 누락 된 레코드를 다른 레코드 (모드)에서 가장 일반적인 값으로 채우고 싶을 수 있습니다. 이러한 접근법은 유감스럽게도 일부 비즈니스 응용 프로그램에서 여전히 자주 사용됩니다.그러나 통계 학자들은 나쁜 생각으로 널리 간주됩니다. 첫째, 통계 분석을하는 전체 요점은 한 결과를 다른 것과 구별하는 데이터를 찾는 것입니다. 누락 된 모든 레코드를 동일한 값으로 바꾸면 아무 것도 구별하지 못합니다.

더 고배차 접근법은 값이 누락 된 각 레코드에 어떤 값을 채워야하는지 의미있는 방식으로 예측하는 방법을 찾기 위해 시도하는 것입니다. 이것은 완전한 기록을보고 부족한 가치가 무엇인지에 대한 단서를 찾으려는 것입니다.

인구 통계 학적 파일을 분석하여 제품 중 하나의 구매자를 예측한다고 가정합니다. 이 파일에는 결혼 상태, 자녀 수, 자동차 수에 대한 정보가 있습니다. 어떤 이유로 인해 레코드의 3 분의 1에 자동 필드 수가 누락됩니다.

다른 두 분야 - 결혼 상태 및 자녀 수 -를 분석하면 몇 가지 패턴을 발견 할 수 있습니다. 독신 사람들은 자동차 한 대를 사는 경향이 있습니다. 결혼하지 않은 아이들이없는 사람들은 2 대의 자동차를 가지고있는 경향이 있습니다. 한 명 이상의 자녀를 둔 기혼 부부는 세 대의 자동차를 가질 가능성이 더 큽니다. 이러한 방식으로 누락 된 값을 실제로 차별화하는 방식으로 추측 할 수 있습니다. 앞으로 나아갈이 접근법에 대해 더 알고 싶습니다.

의심스러운 데이터를 나타내는 통계 및 데이터 처리의 일반적인 용어가 있습니다.

시끄러운

라는 용어는 신뢰할 수 없거나 손상되었거나 원시 상태보다 적은 데이터를 설명하는 데 사용됩니다. 누락 된 데이터는 이것의 한 예입니다. 시끄러운 데이터를 정리하는 기술에 대한 자세한 설명은이 책에서 다루지 않습니다. 사실, 이것은 통계 이론에서 활발한 연구 분야입니다. 모든 소음이 누락 된 값만큼 자리 잡기 쉽지 않다는 사실 때문에 처리하기가 번거로 롭습니다.

누락 된 데이터 - 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...