차례:
- 분석 유형 식별
- 데이터 논쟁은 데이터를 통찰력으로 전환하는 데 필요한 또 다른 중요한 작업입니다. 원시 데이터로부터 분석을 구축하려면 대부분의 경우
- 비즈니스 중심 데이터 과학자는 먼저 현재 문제와 관련이있는 데이터 집합을 식별하고 그 다음에 데이터 집합을 식별해야합니다. 문제를 해결하는 데 필요한 충분한 양의 데이터를 추출하십시오. 데이터 추출 : 데이터 마이닝은 데이터 마이닝을 통해 추출 된 원시 데이터를 정리 한 다음 데이터를보다 편리하게 소비 할 수있는 형식으로 변환합니다 (이 추출 프로세스는 일반적으로 데이터 마이닝이라고합니다). . (Mung은 파괴적인 과정으로 생명을 시작했는데, 인식 할 수없는 것을 무언가로 변환 할 수 있습니다. 따라서 Mash Until No Good이라는 문구 또는 MUNG).
비디오: Overview of IoT Analytics and Big Data ICIP Lesson 2024
원시 데이터를 실용적인 통찰력으로 변환하는 것은 데이터의 진보의 첫 번째 단계입니다 실제로 당신에게 이익이되는 어떤 것으로 모아졌습니다. 비즈니스 중심의 데이터 과학자들은 원시 데이터로부터 통찰력을 얻기 위해 데이터 분석 기법 을 사용합니다.
분석 유형 식별
복잡성이 증가하는 순서로 아래 나열된 네 가지 유형의 데이터 분석이 가장 많이 발생합니다.
-
설명 분석: 이 유형의 분석은 "무슨 일이 일어 났습니까? 기술 분석은 과거 및 현재 데이터를 기반으로합니다. 비즈니스 분석가 또는 비즈니스 중심 데이터 과학자는 설명 분석에 대한 현대 비즈니스 인텔리전스를 기반으로합니다.
-
진단 분석: 이 유형의 분석을 사용하여 질문에 대한 답변을 찾으십시오. "왜 이런 특별한 일이 발생 했습니까? "또는"무엇이 잘못 되었습니까? "진단 분석은 데이터 기반 이니셔티브의 하위 구성 요소의 성공 또는 실패를 추론하고 유추하는 데 유용합니다.
-
Predictive analytics 에는 미래의 사건이나 추세를 예측하기위한 복잡한 모델 구축 및 분석이 포함됩니다. 비즈니스 환경에서 이러한 분석은 비즈니스 중심의 데이터 과학자가 수행합니다. 규정 분석:이 분석 유형은 예측 분석에 기반한 정보에 기반한 조치를 통해 프로세스, 구조 및 시스템을 최적화하는 것을 목표로합니다. 즉, 발생할 것으로 예상되는 정보에 근거하여 수행해야 할 사항을 말합니다. 비즈니스 분석가와 비즈니스 중심의 데이터 과학자 모두 처방 분석을 생성 할 수 있지만 그 방법과 데이터 소스는 다릅니다.
-
애널리틱스의 공통 과제 확인 애널리틱스는 일반적으로 비즈니스에 적어도 두 가지 문제를 제기합니다. 첫째, 조직에서는 분석을 포함하는 특정 기술 집합을 사용하는 신규 고용자를 찾는 것이 매우 어렵습니다. 둘째, 숙련 된 분석가조차도 의사 결정권자가 이해할 수있는 방식으로 복잡한 통찰력을 전달하는 데 어려움을 겪는 경우가 종종 있습니다.
이러한 문제를 극복하기 위해 조직은 분석 제품을 중요하게 여기는 문화를 창작하고 육성해야합니다. 비즈니스는 조직의 모든 수준을 교육해야하므로 관리는 분석의 기본 개념과 구현을 통해 달성 할 수있는 성공을 보장해야합니다. 반대로 비즈니스 중심의 데이터 과학자는 일반적으로 비즈니스에 대한 매우 견고한 실무 지식, 특히 현재 진행중인 비즈니스에 대한 확실한 이해가 있어야합니다. 강력한 비즈니스 지식은 비즈니스 중심 데이터 과학자의 세 가지 주요 요구 사항 중 하나입니다. 다른 두 가지는 강력한 코딩 통찰력과 수학 및 통계 모델링을 통한 강력한 정량 분석 기술입니다.
원시 데이터와 실행 가능한 통찰력의 조화
데이터 논쟁은 데이터를 통찰력으로 전환하는 데 필요한 또 다른 중요한 작업입니다. 원시 데이터로부터 분석을 구축하려면 대부분의 경우
데이터 wrangling
을 사용해야합니다. - 데이터를 한 형식 및 구조에서 정리 및 변환하여 데이터가 정확하고 분석 도구 및 스크립트 형식에서는 소비가 필요합니다.
데이터 추출:
비즈니스 중심 데이터 과학자는 먼저 현재 문제와 관련이있는 데이터 집합을 식별하고 그 다음에 데이터 집합을 식별해야합니다. 문제를 해결하는 데 필요한 충분한 양의 데이터를 추출하십시오. 데이터 추출: 데이터 마이닝은 데이터 마이닝을 통해 추출 된 원시 데이터를 정리 한 다음 데이터를보다 편리하게 소비 할 수있는 형식으로 변환합니다 (이 추출 프로세스는 일반적으로 데이터 마이닝이라고합니다).. (Mung은 파괴적인 과정으로 생명을 시작했는데, 인식 할 수없는 것을 무언가로 변환 할 수 있습니다. 따라서 Mash Until No Good이라는 문구 또는 MUNG).
데이터 거버넌스: 데이터 거버넌스 표준은 사용되는 표준입니다 수동 및 자동 데이터 소스가 현재 모델의 데이터 표준을 준수하는지 확인하기위한 품질 관리 수단입니다. 데이터가 저장되고 사용할 준비가되었을 때 데이터가 올바른 세분성을 갖도록 데이터 거버넌스 표준을 적용해야합니다. 세분성
은 데이터 집합의 세부 수준을 나타내는 척도입니다. 데이터 세분성은 데이터가 분할되는 하위 그룹의 상대적 크기에 의해 결정됩니다.
-
데이터 아키텍처: IT 아키텍처가 핵심입니다. 데이터가 분리 된 고정 리포지토리 (격리 된 악의적 인
-
데이터 사일로 )로 격리되는 경우 특정 비즈니스 라인의 소수 인원 만 사용할 수 있습니다. 사일로 (siled) 데이터 구조는 대다수의 조직의 데이터를 단순히 조직 전체에서 사용할 수없는 상황을 초래합니다. (Siled 데이터 구조는 대단히 낭비적이고 비효율적입니다.)
-
조직의 비즈니스 데이터에서 가장 가치와 통찰력을 이끌어내는 것이 목표라면 데이터가 중앙 데이터웨어 하우스에 저장되고 별도의 사일로가 아닙니다.