비디오: 데이터 시대 주도할 최적의 통합 빅데이터 분석 플랫폼은? 2024
큰 데이터 워크 플로를 이해하려면 프로세스가 무엇인지, 데이터 집약적 인 환경에서 워크 플로와 어떻게 관련되어 있는지 이해해야합니다. 프로세스는 의사 결정에 유용하고 회사 또는 조직에서 일이 이루어지는 방식을 표준화하는 데 유용한 높은 수준의 엔드 - 투 - 엔드 구조로 설계되는 경향이 있습니다. 반면 워크 플로는 작업 지향적이며 종종 프로세스보다 구체적인 데이터가 필요합니다. 프로세스는 프로세스의 전반적인 목표와 관련된 하나 이상의 워크 플로로 구성됩니다.
하나의 기본 작업 흐름은 "피를 뽑는 과정"입니다. "혈액을 채취하는 것은 전반적인 진단 과정을 완료하는 데 필요한 작업입니다. 무언가가 일어나고 혈액이 채취되지 않았거나 혈액 검사 결과가 손실 되었다면 이는 전체 활동의 진실성이나 진실성에 직접적인 영향을 미칩니다.
이 워크 플로우는 특정 바이오 마커 또는 유전 변이를 확인하는 데 필요한 검사를 이해하지 못할 수 있습니다. 바이오 마커 및 돌연변이에 대해 큰 데이터 소스를 제공 한 경우 워크 플로가 실패합니다. 큰 데이터를 인식하지 못하기 때문에 큰 데이터를 지원하기 위해 수정하거나 다시 작성해야합니다.
워크 플로우와 큰 데이터의 효과를 이해하는 가장 좋은 방법은 다음을 수행하는 것입니다.
사용해야 할 큰 데이터 소스를 식별합니다.
-
큰 데이터 유형을 워크 플로우 데이터 유형에 매핑하십시오.
-
워크 플로우를 지원할 수있는 처리 속도 및 저장 영역 액세스 권한이 있는지 확인하십시오.
-
데이터 유형에 가장 적합한 데이터 저장소를 선택하십시오.
-
기존 워크 플로우를 수정하여 큰 데이터를 수용하거나 새로운 빅 데이터 워크 플로우를 생성하십시오.
-
큰 데이터 워크 플로우를 얻은 후에는 분석을 어렵게하거나 오염시키지 않도록 미세 조정이 필요합니다.예를 들어 많은 큰 데이터 소스에는 잘 정의 된 데이터 정의 및 해당 소스 요소에 대한 메타 데이터가 포함되어 있지 않습니다. 경우에 따라 이러한 데이터 원본이 정리되지 않은 경우도 있습니다. 당신은 당신이 사용할 소스에 대해 올바른 수준의 지식을 갖고 있는지 확인해야합니다.