비디오: What is Apache Hive? : Understanding Hive 2024
Hive는 Hadoop에 RDBMS 세계에 대한 다리를 제공합니다. SQL과 유사한 태스크를 수행하는 데 사용할 수있는 Hive Query Language (HiveQL)로 알려진 SQL 다이얼 렉트를 제공합니다. 이것은 큰 뉴스이지만 하이브는 표준 엘리베이터 피치에서 볼 수있는 것보다 눈에 보이는 것보다이 하이테크 기술이 더 많이 적용되는 것보다 많습니다.
예를 들어 Hive는 데이터웨어 하우스가 데이터 분석 및보고를 위해 특별히 구축 된 RDBMS로 설정된 Apache Hadoop의 주요 사용 사례 인 엔터프라이즈 데이터웨어 하우스 (EDW) 기능 보강이라고도합니다.
추가되었으며 기존 EDW를 보완하고 보완 할 수 있습니다. Hive, HBase 및 Sqoop을 사용하면 EDW 기능을 사용할 수 있습니다. RDBMS / EDW 기술과 밀접하게 관련된 것은 ETL (추출, 변환 및로드) 기술입니다. ETL의 역할을 파악하기 위해 많은 경우에 데이터를 관계형 데이터베이스에 즉시로드 할 수 없다는 것을 알기 쉽습니다. 먼저 원시 소스에서 추출하여 적절한 형식으로 변환 한 다음 RDBMS에로드하거나 EDW.새 ETL 도구로 설정하려고 시도 할 수 있습니다. (시도하도록하십시오.)
마지막으로, Apache Hive는 강력한 분석 도구를 제공하며 모두 HiveQL 프레임 워크 내에서 제공됩니다. 이러한 도구는 SQL을 사용하는 방법을 이해하는 IT 전문가에게 매우 친숙해야합니다.