비디오: Smash Bros. Ultimate's Staggering Digital Sales in Japan & New NES Switch Games Revealed! | PE NewZ 2024
데이터웨어 하우스 디럭스 구현은 커지고 항상 커지고 있습니다. 수백 기가 바이트 (기가 바이트는 10 억 바이트) 및 심지어 테라 바이트 (1 조 바이트)를 사용하는 구현이 점점 더 보편화됩니다. 이러한 양의 데이터와 사용자 액세스를 관리하려면 매우 강력한 서버와 데이터베이스가 필요합니다.
도전을 준비하십시오! 데이터웨어 하우스 라이트를 사용하면 보통 소스에서웨어 하우스로의 데이터 이동을 간단하면서도 기술적 인 방식으로 처리 할 수 있습니다. 그러나 데이터웨어 하우스 디럭스를 사용하면 많은 데이터웨어 하우징 프로젝트가 충족되는 난이도 영역으로 진입하게됩니다. 워털루.
여러 영역에서 어려움을 겪을 수 있습니다.
-
많은 다른 데이터 소스를 다루고 있습니다. 일부 데이터에는 중복되는 데이터가 포함될 수 있습니다. 예를 들어, 공급 업체의 정보는 서로 다른 두 가지 구매 시스템에서 나올 수 있으며 일부 공급 업체는 두 시스템에 모두 입력 할 수 있습니다.
수렴해야하는 다른 식별자 집합 (예: 시스템 중 하나에서 SUPPLIER_ID로 식별되는 6 개의 영숫자 및 다른 하나에서 SUP_NUM으로 알려진 고유 한 정수)을 실행하게됩니다.
-
데이터웨어 하우스가 크면 (약 250GB 이상 측정) 배치 창을 추출, 이동 및로드하는 데 어려움을 겪을 수 있습니다. 웨어 하우스에 대한 업데이트가 수행되는 일괄 처리 윈도우 , 는 처리해야하는 데이터 소스의 수에 따라 복잡합니다.
-
엉망진창 추출, 이동, 변환 및로드 프로세스의 기회는 데이터웨어 하우스에로드 할 데이터 요소의 수와 기하 급수적으로 관련됩니다.
웨어 하우스에 데이터를 가져 오는 프로세스에 어려움 요소 (예: 정수)를 할당 할 수있는 경우 다음과 같은 조치가 적용됩니다. n 데이터가 있음 x의 난이도를 가진 데이터웨어 하우스에 포함하려는 요소. 2 999 n 999 데이터 요소가있는 경우 난이도 요소는 2 999 x가 아닙니다. 오히려 x 제곱입니다. 이 난이도를 이해하기 쉽게하려면 n 및
x에 일부 숫자를 할당하십시오. 데이터웨어 하우스에 100 개의 요소가 있고 (n) , 난이도 요소 (x) 가 5라고합시다. 요소의 수를 두 배로하면 > = 200), 난이도는 25 (5 제곱), 10 (5 x 2)이 아닙니다. 하나의 장소 (데이터웨어 하우스 디럭스)로 향하는 많은 데이터 소스를 다루는 프로세스는 주방에 너무 많은 요리사의 모든 요소를 담고 있습니다. 추출, 이동, 변환 및 로딩 프로세스를 원활하게 진행하려면 많은 다른 응용 프로그램 소유자, 데이터베이스의 공식 관리자 및 다양한 조직의 다른 사람들을 다뤄야 할 것입니다. 그들이 전문 교향악단의 일원처럼 협력하십시오. 현실은 장난감 빈에서 악기를 고르는 유치원 학생들과 더 흡사하며 "이제 놀아 라!"라고 말합니다. "프로세스가 반드시 실패 할 운명은 아니지만 데이터웨어 하우스 디럭스가 제대로로드 될 때까지 여러 번 반복 해보십시오. 데이터웨어 하우스 디럭스는 더 많은 데이터 소스와웨어 하우스에 액세스하는 두 가지 유형 이상의 사용자 도구를 제외하고는 3 계층 (데이터웨어 하우스 라이트)을 가질 수 있습니다. 그러나 데이터웨어 하우스 디럭스의 아키텍처는 데이터에 대한 여러 가지 수집 지점과 함께이 그림에 표시된 것과 비슷합니다. 데이터 마트:
-
데이터웨어 하우스 디럭스에서 정보의 서브 세트를 수신하고 데이터웨어 하우스 디럭스의 기본 액세스 포인트로 사용됩니다.
특정 환경에 필요한 다른 "way station"외에도 환경에 다음 요소가있을 수 있습니다. 사용자.
중간 변환 스테이션:
일부 원본에서 추출 된 데이터 집합이 파이프 라인을웨어 하우스 데이터베이스쪽으로 이동하기 전에 일부 유형의 변환 프로세스를 거치는 영역입니다.
품질 보증 스테이션:
-
데이터 그룹이 데이터웨어 하우스로 이동하기 전에 집중적 인 품질 보증 검사를받는 영역입니다.