비디오: Ch0206.기술통계분석(범주형)(다변량분석 분할표)06 2024
데이터 마이닝 프로세스의 데이터 이해 단계의 기본 부분은 변수를 한 번에 하나씩 조사하고 배포본을 검토하며 명백한 데이터 품질 문제를 확인하는 것입니다. 막 대형 차트 및 히스토그램은 다양한 분포를 쉽고 빠르게 이해할 수있는 시각적 요약입니다.
두 차트 유형은 매우 유사합니다. 변수가 범주 형이면 막대 차트를 사용하십시오. 각 카테고리에 대해 하나의 막대가 있고 막대의 높이는 각 카테고리의 빈도를 표시합니다. 변수가 연속이면 히스토그램을 사용하십시오. 히스토그램에서 각 막대는 변수의 값 범위를 나타냅니다.
데이터 마이닝 응용 프로그램을 사용하면 이러한 차트를 매우 쉽게 얻을 수 있습니다. 이들은 종종 범용 데이터 요약 도구의 출력에 포함됩니다.
하지만 원하는 차트를 얻는 것이 항상 쉬운 것은 아닙니다. 자세히 살펴보면 막대 차트 아래에 차트 열기 라는 문구가 표시됩니다. 이 링크를 클릭하면 차트 편집기가 열립니다. 에디터에서 열어 놓은 데이터 요약과 동일한 차트를 볼 수 있습니다. 다음 그림은이 방법으로 열 때 보이는 차트 편집기를 보여줍니다.
동일하지 않음! 동일한 지점으로 돌아가려면 설치 프로그램에 소동해야합니다.
하지만이 차트 편집기는 다른 방식으로 가치를 제공합니다. 보다 정교한 차트 구조 (다음 그림은 복잡한 그래프 구조를 허용하는 편집기를 보여줍니다) 또는 색상과 같은 미용 요소를 제어하는 것과 같은 더 많은 옵션을 제공합니다. 차트 편집기는 보고서 또는 프리젠 테이션에 사용할 수 있도록 그래프를 내보내는 경로도 제공합니다.
이 섹션에서 볼 수있는 차트 설정의 복잡성은 제품 디자인의 문제입니다. 데이터 마이닝 응용 프로그램은 일부 작업을 매우 쉽게하고 다른 작업은 상당히 복잡하거나 불가능하게 할 수 있습니다. 어느 누구도 쉽게 사용할 수있는 다른 모든 제품보다 뛰어난 제품은 없지만 다른 제품보다 작업 스타일에 더 잘 어울리는 제품 일 수 있습니다. 따라서 사용하기에 앞서 제품을 사용하기 전에 필요한 작업에 대해 철저히 시험해보십시오.