비디오: 트랙 3-4. BigQuery를 이용한 데이터 웨어하우징 (하정애) 2024
데이터웨어 하우스에 필요한 외부 데이터를 생각할 때이를 과장하지 마십시오. 웨어 하우스의 내부 데이터에도 적용되는 것과 동일한 규칙이 외부 소스 데이터에도 적용됩니다. 분석, 의사 결정 및 분석 작업을 수행하기 전에 분석 및 의사 결정 과정에서 비즈니스 가치가 이 모든 데이터를 저장하고 사용할 수있게합니다. 경쟁사의 판매 데이터가 귀하의 행동을 명확하게 파악하는 데 도움이된다면 가져 가십시오. 특정 도시 인구가 급격히 증가하거나 감소한다는 지식이 회사의 의사 결정에 영향을주지 않는다면 왜 그 데이터를 수집하고 저장해야합니까?
데이터웨어 하우스의 원시 데이터를 고려할 때 더 많은 것이 분명히 좋다고 생각하는 유혹을받을 수 있습니다. 그러나 내부적으로 제공되는 데이터와 마찬가지로 수집 할 데이터를 고려하기 전에 비즈니스 요구 분석을 적용해야합니다.
따라서 제거 프로세스를 통해 사용자 커뮤니티의 나머지 부분을 외부 데이터 비즈니스 요구 분석의 일부로 만들어야합니다. 가능한 빨리이 그룹에 속한 사용자를 파악하여 분석 및 디자인 노력에 집중할 수 있습니다. 다음 단계를 따르십시오.
전체 사용자 목록을 재확인하십시오.
이 목록에는 잠재적 인 데이터웨어 하우스 사용자 인 회사의 모든 사람이 포함됩니다. 목록에있는 모든 사용자가 여전히 데이터웨어 하우스를 사용할 후보입니까? (또는 이미 데이터웨어 하우스를 배포 한 경우 목록의 모든 사용자가 실제로 사용합니까?)-
목록에 다른 사람을 추가해야합니까? 데이터웨어 하우스 사용자 목록의 정확성에 만족하는 경우 2 단계로 계속 진행하십시오. 그렇지 않은 경우 올바른 때까지 목록을 조정하십시오.
목록에있는 각 사람에게 다음 질문에 답하십시오. 할당 된 비즈니스 기능을 가장 효과적으로 수행하려면이 사람은 회사의 내부 컴퓨터 시스템에서 사용할 수없는 데이터가 필요합니까?
인터뷰 결과를 사용하여 외부 데이터 요구 사항의 통합 목록, 데이터를 얻을 수있는 출처, 가격 및 수수료, 제한 사항 및 연락처 정보를 작성하십시오.
-
예산 승인에 대해 프로젝트 스폰서와상의하십시오.
-
귀하의 회사가 요구하는 것이 무엇이든 요청하십시오.
-
대다수의 사용자 집단 (100 명 이상)을 다루는 경우, 데이터웨어 하우징 개발자는 지름길을 택하고 이전 질문을 개별 사용자가 아닌 사용자 그룹에 적용하는 경향이 있습니다..
예를 들어, 한 은행의 신용 분석 기관 (예: 마사, 로빈, 카렌, 로버트, 시드니)이 신용 리스크 분석가의 이름이 같은 모든 사람이 조직도의 동료로 Suellen에보고하면 데이터웨어 하우스를 사용하면 그룹 전체에서 동일한 데이터 요구 사항이 적용됩니다. 맞습니까?
실수하지 마십시오. 더 많은 경우에있어서,이 크기의 그룹에는 적어도 두 개의 서로 다른 비즈니스 역할이 있으며 각각은 서로 다른 외부 데이터 (내부 데이터는 말할 필요도 없음)를 필요로합니다. 로빈 (Robin)과 로버트 (Robert)는 예를 들어 신용 카드 위험에 집중할 수 있으므로 은행 카드에 대해서만 신용 점수와 시장 데이터가 필요합니다. 그룹의 다른 사람들은 할부 대출 위험에 집중할 수 있으므로 자동차, 중소기업 및 서명과 같은 여러 유형의 할부 대출에 대한 외부 신용 위험 데이터 및 기타 시장 데이터가 필요합니다.
로빈과 함께 일하며 신용 카드 지향 외부 데이터가 필요하지만 액세스 할 수 있더라도 외부 제공 할부 대출 데이터를 사용하지 않는다는 사실을 알게되면 절대 안된다고 가정하고 싶지는 않습니다 로빈 (Robin) 조직의 한 분은 할부 대출 데이터가 필요하며 그 정보를 추구 할 필요가 없습니다.
조금 시간이 걸릴지라도 모두에게 이야기하십시오.