비디오: Microsoft Azure OpenDev—June 2017 2024
데이터 마이닝은 시행 착오를 거치므로 데이터 마이너의 경우 실수를하는 것이 당연합니다. 실수는 적어도 특정 조건 하에서는 가치가있을 수 있습니다. 그러나 모든 실수가 동등하게 만들어지는 것은 아닙니다. 일부는 더 잘 피할 수 있습니다. 다음 목록은 그러한 실수를 10 가지 제시합니다. 주의 깊게 읽었을 때 기억에 맡기면 학습 곡선에 몇 가지 충돌을 피할 수 있습니다.
-
데이터 품질 검사 건너 뛰기: 대부분의 데이터 조사자는 품질 문제에 대한 데이터를 검토하는 것보다 예측 모델을 개발하는 것이 더 재미 있다고 생각합니다. 그러나 데이터 품질 문제를 감지하고 수정하지 않으면 쓸모없는 예측으로 끝날 수 있습니다.
-
요점을 놓치기: 당신은 매혹적인 것을 발견했습니다! 좋은 생각입니다.하지만 해결해야 할 비즈니스 문제와 관련이 없다면, 전혀 관련이 없습니다. 다시 궤도에 올라 타.
-
데이터 패턴이 원인과 결과의 관계를 증명한다고 믿습니다. 데이터 세트를 탐색하고 변수 A가 증가하면 변수 B도 증가합니다. 이것은 변수 A가 변수 B에 영향을 주거나 변수 B가 변수 A에 영향을주기 때문에 발생할 수 있습니다. 다른 한편으로는 두 변수 모두 고려하지 않은 다른 변수의 영향을받을 수 있습니다. 아니면 일회성 우연 일 수도 있습니다. 누가 말할 수 있니?
-
다른 상황에서 데이터에서 관찰 한 관계가 반복된다고 추정하지 마십시오. 시원한 환경에서 데이터를 수집 한 경우 뜨거운 공장 환경에서 동일한 방식으로 작동한다고 가정하지 마십시오. 의미가없는 결과에 도박:
-
데이터 마이닝 방식은 비공식적이며 과학적 방법과 이론으로 백업되지 않는 경우가 많으므로 결과가 비즈니스에 이상이없는 것이 좋습니다. 제시 한 결과에 대한 상식적인 설명이 없다면 경영진은 진지하게 받아들이지 않을 것이며 그렇게해서는 안됩니다. 특정 모델링 방법에 대한 관심 부족:
-
모든 상황에 적합한 단일 유형의 데이터 마이닝 모델이 없습니다. 적절한 테스트없이 모델을 생산에 적용:
-
홀드 아웃 데이터로 테스트하고 현장에서 소규모로 테스트 할 때까지 예측 모델에 비즈니스를 걸지 마십시오. 싫어하는 결과 무시:
-
지금 데이터를 무시하면 언젠가는 다시 돌아와서 말합니다. " 데이터 마이닝을 사용하여 모든 데이터 분석 요구 사항 해결:
-
데이터 마이닝은 엄청난 가치가 있지만 아직 일부 애플리케이션은 여전히 엄격한 데이터 수집 방법, 공식적인 통계 분석 및 과학적 방법을 필요로합니다. 기존의 데이터 분석 기법이 더 이상 중요하지 않다고 생각할 때:
-
이전 글 머리표를 참조하십시오.