비디오: [메타데이터] ep1. 메타데이터의 정의와 중요성 2024
데이터웨어 하우스 라이트는 데이터를 제공하기위한 기본 제공 방식으로, 비즈니스 의사 결정. No-Fill은 가능하면 조직 내에서 이미 입증 된 기능과 도구를 함께 사용하여 시스템을 구축한다는 의미입니다.
데이터웨어 하우스 라이트의 주제 영역 및 데이터 컨텐츠
데이터웨어 하우스 라이트는 하나 또는 두 개의 주제 영역에 대한보고 또는 분석에만 초점을 맞 춥니 다. 전화 회사의 무선 사업부에서 일하면서 네트워크 내 분, 네트워크 외부 분, 문자 메시지, 인터넷 액세스 및 기타 모바일 사용과 같은 서비스 판매를 소비자 가정에 분석한다고 가정 해보십시오.
이 목적을 위해 독점적으로 데이터웨어 하우스 라이트를 구축하면 소비자 시장 분석 및보고를 지원하는 데 필요한 모든 정보가 제공됩니다. 그러나 비즈니스 사용자 및 지불 내역에 대한 정보는이 그림에 표시된 것과 같이 다른 주제 영역의 일부이기 때문에 정보가 없습니다.
모든 가능한 데이터 요소 집합 중에서 신중하게 선택해야하며 다루기 쉬운 하위 집합을 선택해야합니다. 의심 할 여지없이 중요한 요소입니다. 이 프로세스는 모든 데이터웨어 하우스 구현에 대해 동일하지만 포함 할 콘텐츠를 결정할 때 매우주의해야합니다.
데이터 소스
데이터웨어 하우스 라이트는 제한된 데이터 소스 집합 (일반적으로 소수 ~ 소수)을 가지고 있습니다. 예를 들어 전반적인 단일 응용 프로그램 환경의 일부로 데이터웨어 하우스 라이트는 응용 프로그램의 데이터에 대한 구조 조정 에이전트 역할을하여 더 많은 쿼리 및 보고서 친숙성을 제공합니다.
단일 응용 프로그램의 데이터를 재구성하는 가장 일반적인 방법은 응용 프로그램의 관계형 데이터베이스 테이블 내용을 비정규 화하여 많은
관계형 조인 작업 (하나 이상의 데이터베이스 테이블에서 데이터를 가져 오는 프로세스) 사용자가 보고서를 실행하거나 간단한 쿼리를 수행 할 때 가능한 한 비정규 화는 정규화라는 관계형 데이터베이스의 개념과 반대입니다. 정규화는 데이터베이스의 어떤 테이블에 어떤 데이터 요소가 있어야 하는지를 알려주는 다소 복잡한 지침 집합입니다.
데이터베이스를 비정규 화하면 (), 중복 된 데이터는 걱정하지 않아도됩니다. 사용자가 실행하는 보고서와 쿼리를 대부분 미러링하는 단일 테이블에 데이터 행을 만들려고합니다. 이 그림은 비정규 화시 작성된 단일 소스 데이터웨어 하우스 라이트의 예를 보여줍니다. 데이터웨어 하우스 라이트 구현에서 외부 제공 데이터를 사용할 수 있지만 사용하는 데이터는 거의 새로 취득하지 않습니다. 분석을 위해 이미 사용하고있는 데이터를 통합 할 가능성이 높습니다 (독립 실행 형). 비즈니스 인텔리전스 도구
데이터웨어 하우스 라이트 사용자는 일반적으로 질문을하고 "나에게 어떤 일이 일어 났는지"를 나타내는 보고서를 작성합니다. 이러한 사용자는 많은 양의 분석 작업을 수행하지 않으므로 데이터웨어 하우스에 액세스하는 데 사용하는 제품이 사용하기 쉽습니다.
데이터 추출, 이동 및 로딩
단순성은 데이터웨어 하우스 라이트의 게임 이름입니다. 따라서 소스에서 데이터를 추출하고이 두 요소를 사용하여 가능한 빨리로드하기 위해 데이터를 준비하는 데 필요한 모든 기능을 수행하는 프로세스를 수행하십시오.
run-the-business 시스템의 단순 파일 추출 및 소스에서 데이터웨어 하우스 라이트로 데이터 이동
데이터 추출 및 이동이 가능한 간단한 사용자 정의 코드 (또는 사용하기 쉬운 도구)
-
데이터웨어 하우스 라이트의 데이터 소스가 관계형 데이터베이스를 기반으로 구축되었으며 데이터웨어 하우스에 대해 동일한 데이터베이스 제품을 사용하려는 경우 SQL을 사용하여 데이터 추출 및 이동을 쉽게 처리 할 수 있습니다. 이 단계는 그림과 같이이 프로세스에 대한 표준 프로 시저를 제공합니다 (물론 특정 환경에 맞게이 단계를 조정해야합니다).
-
웨어 하우스가있는 시스템에서 SQL CREATE TABLE 문을 사용하여 데이터웨어 하우스 라이트의 각 테이블에 대한 정의를 만듭니다.
웨어 하우스에 데이터를 제공하는 소스의 모든 테이블의 사본을 포함하는 데이터베이스
-
백업
-
을 작성한 다음 해당 테이블을 데이터웨어 하우스를 찾을 시스템의 스테이징 영역으로 다시로드하십시오. 파일 전송 프로그램을 사용하여 네트워크 대역폭과 시간대가 모든 소스 테이블을 시스템에 복사 할 수 있는지 확인해야합니다. 데이터웨어 하우스 테이블을 채울 원본 테이블과 각 열 (및 테이블 조인 방법)을 지정하는 중첩 된 SELECT 문을 사용하여 SQL INSERT 문을 사용하여 데이터웨어 하우스에 데이터를로드합니다.
일련의 품질 보증 (QA) 루틴을 실행하여 모든 데이터가 올바르게로드되었는지 확인합니다.
-
행 수, 숫자 합계 및 가능한 모든 항목을 확인하십시오.
-
아키텍처
데이터웨어 하우스 라이트의 아키텍처는 데이터를 저장하는 데 사용되는 데이터베이스, 데이터에 액세스하는 데 사용되는 프런트 엔드 비즈니스 인텔리전스 도구, 데이터 이동 방법 및 주체 수로 구성됩니다 지역.이 환경의 표어는 미니멀리즘입니다. 종소리도, 호루라기도, 환상적인 것도 없습니다. 사용자가 필요한 데이터에 액세스 할 수 있도록 충분한 기술을 적용했습니다.
그림과 같이 데이터웨어 하우스 라이트의 아키텍처에는 다음과 같은 주요 구성 요소 유형이 있습니다.
단일 데이터베이스에는웨어 하우스의 데이터가 포함됩니다.
그 데이터베이스는 창고에 데이터를 제공하는 각 출처로부터 직접 공급됩니다.
-
사용자는 창고에서 직접 데이터에 액세스합니다.