애널리틱스와 데이터 배포 원시 데이터를 실용적인 통찰력으로 변환하기위한 논쟁 - 인형

비디오: Overview of IoT Analytics and Big Data ICIP Lesson 2025

원시 데이터를 실용적인 통찰력으로 변환하는 것은 데이터의 진보의 첫 번째 단계입니다 실제로 당신에게 이익이되는 어떤 것으로 모아졌습니다. 비즈니스 중심의 데이터 과학자들은 원시 데이터로부터 통찰력을 얻기 위해 데이터 분석 기법 을 사용합니다.

분석 유형 식별

복잡성이 증가하는 순서로 아래 나열된 네 가지 유형의 데이터 분석이 가장 많이 발생합니다.

설명 분석: 이 유형의 분석은 "무슨 일이 일어 났습니까? 기술 분석은 과거 및 현재 데이터를 기반으로합니다. 비즈니스 분석가 또는 비즈니스 중심 데이터 과학자는 설명 분석에 대한 현대 비즈니스 인텔리전스를 기반으로합니다.
진단 분석: 이 유형의 분석을 사용하여 질문에 대한 답변을 찾으십시오. "왜 이런 특별한 일이 발생 했습니까? "또는"무엇이 잘못 되었습니까? "진단 분석은 데이터 기반 이니셔티브의 하위 구성 요소의 성공 또는 실패를 추론하고 유추하는 데 유용합니다.
Predictive analytics 에는 미래의 사건이나 추세를 예측하기위한 복잡한 모델 구축 및 분석이 포함됩니다. 비즈니스 환경에서 이러한 분석은 비즈니스 중심의 데이터 과학자가 수행합니다. 규정 분석:이 분석 유형은 예측 분석에 기반한 정보에 기반한 조치를 통해 프로세스, 구조 및 시스템을 최적화하는 것을 목표로합니다. 즉, 발생할 것으로 예상되는 정보에 근거하여 수행해야 할 사항을 말합니다. 비즈니스 분석가와 비즈니스 중심의 데이터 과학자 모두 처방 분석을 생성 할 수 있지만 그 방법과 데이터 소스는 다릅니다.
애널리틱스의 공통 과제 확인 애널리틱스는 일반적으로 비즈니스에 적어도 두 가지 문제를 제기합니다. 첫째, 조직에서는 분석을 포함하는 특정 기술 집합을 사용하는 신규 고용자를 찾는 것이 매우 어렵습니다. 둘째, 숙련 된 분석가조차도 의사 결정권자가 이해할 수있는 방식으로 복잡한 통찰력을 전달하는 데 어려움을 겪는 경우가 종종 있습니다.
이러한 문제를 극복하기 위해 조직은 분석 제품을 중요하게 여기는 문화를 창작하고 육성해야합니다. 비즈니스는 조직의 모든 수준을 교육해야하므로 관리는 분석의 기본 개념과 구현을 통해 달성 할 수있는 성공을 보장해야합니다. 반대로 비즈니스 중심의 데이터 과학자는 일반적으로 비즈니스에 대한 매우 견고한 실무 지식, 특히 현재 진행중인 비즈니스에 대한 확실한 이해가 있어야합니다. 강력한 비즈니스 지식은 비즈니스 중심 데이터 과학자의 세 가지 주요 요구 사항 중 하나입니다. 다른 두 가지는 강력한 코딩 통찰력과 수학 및 통계 모델링을 통한 강력한 정량 분석 기술입니다.

원시 데이터와 실행 가능한 통찰력의 조화

데이터 논쟁은 데이터를 통찰력으로 전환하는 데 필요한 또 다른 중요한 작업입니다. 원시 데이터로부터 분석을 구축하려면 대부분의 경우

데이터 wrangling

을 사용해야합니다. - 데이터를 한 형식 및 구조에서 정리 및 변환하여 데이터가 정확하고 분석 도구 및 스크립트 형식에서는 소비가 필요합니다.

데이터 추출:

비즈니스 중심 데이터 과학자는 먼저 현재 문제와 관련이있는 데이터 집합을 식별하고 그 다음에 데이터 집합을 식별해야합니다. 문제를 해결하는 데 필요한 충분한 양의 데이터를 추출하십시오. 데이터 추출: 데이터 마이닝은 데이터 마이닝을 통해 추출 된 원시 데이터를 정리 한 다음 데이터를보다 편리하게 소비 할 수있는 형식으로 변환합니다 (이 추출 프로세스는 일반적으로 데이터 마이닝이라고합니다).. (Mung은 파괴적인 과정으로 생명을 시작했는데, 인식 할 수없는 것을 무언가로 변환 할 수 있습니다. 따라서 Mash Until No Good이라는 문구 또는 MUNG).

데이터 거버넌스: 데이터 거버넌스 표준은 사용되는 표준입니다 수동 및 자동 데이터 소스가 현재 모델의 데이터 표준을 준수하는지 확인하기위한 품질 관리 수단입니다. 데이터가 저장되고 사용할 준비가되었을 때 데이터가 올바른 세분성을 갖도록 데이터 거버넌스 표준을 적용해야합니다. 세분성

은 데이터 집합의 세부 수준을 나타내는 척도입니다. 데이터 세분성은 데이터가 분할되는 하위 그룹의 상대적 크기에 의해 결정됩니다.

데이터 아키텍처: IT 아키텍처가 핵심입니다. 데이터가 분리 된 고정 리포지토리 (격리 된 악의적 인
데이터 사일로 )로 격리되는 경우 특정 비즈니스 라인의 소수 인원 만 사용할 수 있습니다. 사일로 (siled) 데이터 구조는 대다수의 조직의 데이터를 단순히 조직 전체에서 사용할 수없는 상황을 초래합니다. (Siled 데이터 구조는 대단히 낭비적이고 비효율적입니다.)
조직의 비즈니스 데이터에서 가장 가치와 통찰력을 이끌어내는 것이 목표라면 데이터가 중앙 데이터웨어 하우스에 저장되고 별도의 사일로가 아닙니다.