비디오: Summit Seoul '19 T1-1. Google Cloud Platform에서 데이터 레이크 만들기 (송영탁) 2024
데이터웨어 하우징을 계획 할 때는 오늘날의 데이터 환경은 이제 새로운 정보 채널, 새로운 데이터 소스, 새로운 분석 및보고 의무를 어지럽게 배열하고 있습니다.
애널리스트 그룹에 따르면 오늘날 데이터의 거의 80 ~ 85 %는 구조화되지 않았으며 웹, 전자 메일, IP (Voice over IP), 인스턴트 메시징 (IM), 문자 메시지 및 팟 캐스트와 같은 새로운 정보 채널이 빠르게 커지고 있습니다 비 전통적 데이터의 저장. 이러한 출처의 데이터는 사용자가 데이터웨어 하우스에 통합되도록 요청됩니다.
-뛰어난 최신의 데이터웨어 하우스를 사용하지 않은 경우 비즈니스 인텔리전스 기능은 다음 유형의 데이터로 제한되었을 가능성이 있습니다.
-
숫자: 숫자 텍스트:
-
문자 데이터, 일반적으로 고정 길이 영숫자 정보로, 발생 건수는 거의 255자를 넘지 않지만, 드물게 4,000 개까지 올 수도 있습니다. 문자 실제 날짜 및 시간 또는보다 가능성있는 날짜 범위 (제품 판매가 그룹화되어 저장되는 월 및 연도 등)
-
그것. 보고서 및 분석을 지원하기 위해 레거시 응용 프로그램에서 가져온 정보의 저장 장소 인 원래 화신의 데이터웨어 하우징은 이러한 기존 데이터 유형 이외의 다른 것을 필요로하지 않았습니다. 이러한 전통적인 데이터 유형은 데이터베이스에 의해 관리되는 구조화 된 데이터의 기초를 형성하며 가장 인기있는 것은 관계형 데이터베이스 또는 다차원 데이터베이스입니다.
->
당신은 Bob Dylan이 당시와 그들이 어떻게 변했는지에 대해 뭐라 말했는지 알 것입니다.