개인 재정 Apache Hive의 아키텍처 - Dummy

Apache Hive의 아키텍처 - Dummy

비디오: What is Hive and HiveQL? | Apache Hive Tutorial for Beginners | Hive Architecture | COSO IT 2024

비디오: What is Hive and HiveQL? | Apache Hive Tutorial for Beginners | Hive Architecture | COSO IT 2024
Anonim

Apache Hive의 요소를 살펴보면 아래쪽에 Hive가 Hadoop Distributed File System (HDFS) 및 MapReduce 시스템.

MapReduce의 경우 그림은 Hadoop 1과 Hadoop 2 구성 요소를 모두 보여줍니다. Hadoop 1을 사용하면 Hive 쿼리가 MapReduce 코드로 변환되어 JobTracker 및 TaskTracker와 같은 MapReduce v1 (MRv1) 인프라를 사용하여 실행됩니다.

Hadoop 2를 사용하여 YARN은 MapReduce 프레임 워크에서 리소스 관리 및 스케줄링을 분리했습니다. MapReduce v2 (MRv2) 및 YARN 인프라로 하이브 쿼리를 MapReduce 코드로 변환하여 실행할 수 있습니다.

Apache Tez이라는 개발중인 새로운 프레임 워크가 있습니다.이 프레임 워크는 배치 스타일 쿼리의 하이브 성능을 향상시키고 더 작은 대화 형 (또는 실시간 ) 쿼리를 지원하도록 설계되었습니다. 작성 당시 Apache Tez 프로젝트는 여전히 보육 중이며 아직 제작 준비가되지 않은 릴리스입니다.

모든 조각이 어떻게 맞는지 시각화하는 데 도움이된다면 HDFS 및 MapReduce 시스템을 Hive와 함께 Apache Hadoop 운영 체제의 일부로 간주하고 HBase와 같은 다른 구성 요소 - 더 높은 수준의 기능 또는 응용 프로그램으로. HDFS는 저장소를 제공하고 MapReduce는 하둡 생태계 내에서 상위 수준 기능을위한 병렬 처리 기능을 제공합니다.

다이어그램 위로 이동하면 HiveQL을 컴파일, 최적화 및 실행하는 Hive Driver가 있습니다. Hive 드라이버는 현재 작업에 따라 HiveQL 문과 명령을 로컬에서 실행하거나 MapReduce 작업을 생성하도록 선택할 수 있습니다. 하이브 드라이버는 메타 데이터와 데이터베이스에 테이블 메타 데이터를 저장합니다.

SQL과 RDBMS 세계의 관계형 데이터베이스 모델에 어느 정도 익숙 할 것입니다. 테이블 또는 관계 는 세로 열과 가로 행으로 구성됩니다. 행과 열이 교차하는 곳에 셀 이 저장됩니다. SQL과 관계형 데이터베이스 모델에 익숙하지 않은 경우 좋아하는 검색 엔진을 사용하여 유용한 학습 소스를 찾을 수 있습니다.

기본적으로 Hive에는 내장 모드로 불리는 metastore로 구성된 Apache Derby RDBMS가 포함되어 있습니다. 내장 모드 는 하이브 드라이버, 메타 스토어 및 Apache Derby가 모두 하나의 JVM (Java Virtual Machine)에서 실행되고 있음을 의미합니다.

이 구성은 학습 목적으로 적합하지만 임베디드 모드는 단일 하이브 세션 만 지원할 수 있으므로 일반적으로 다중 사용자 프로덕션 환경에서는 사용되지 않습니다.프로덕션 환경에서 여러 하이브 세션을보다 잘 지원할 수있는 로컬 및 원격 모드가 있습니다. 또한 JDBC (Java Database Connectivity) API (Application Programming Interface) 제품군과 호환되는 모든 RDBMS를 구성 할 수 있습니다. (여기에는 MySQL과 DB2가 포함됩니다.)

애플리케이션 지원의 핵심은 풍부한 클라이언트 세트가 Hive 서브 시스템에 액세스 할 수있게 해주는 Hive Thrift Server입니다. 오픈 소스 SQuirreL SQL 클라이언트가 예제로 포함되어 있습니다. 요점은 모든 JDBC 호환 응용 프로그램이 번들 된 JDBC 드라이버를 통해 하이브에 액세스 할 수 있다는 것입니다.

ODBC (Open Database Connectivity)에 부합하는 클라이언트에도 똑같은 성명이 적용됩니다. 예를 들어 unixODBC와 isql 유틸리티는 일반적으로 Linux에 번들되어 있으며 원격 Linux 클라이언트에서 Hive에 액세스 할 수 있습니다.

또한 Microsoft Excel을 사용하는 경우 클라이언트 시스템에 Microsoft ODBC 드라이버를 설치 한 후 Hive에 액세스 할 수 있다는 사실을 알게되어 매우 기쁩니다. 마지막으로, Java (PHP 나 Python과 같은 프로그래밍 언어)에서 Hive에 액세스해야하는 경우 Apache Thrift가 답입니다. Apache Thrift 클라이언트는 JDBC 및 ODBC 클라이언트처럼 Hive Thrift Server를 통해 하이브에 연결합니다.

Hive 아키텍처 도면을 계속 사용하려면 Hive에 명령 줄 인터페이스 (Command Line Interface, CLI)가 포함되어 있습니다. 여기서 Linux 터미널 창을 사용하여 쿼리 및 관리 명령을 하이브 드라이버에 직접 실행할 수 있습니다. 그래픽 방식의 속도가 더 빨라지면 편리한 웹 인터페이스가있어서 좋아하는 브라우저를 통해 하이브 관리 테이블과 데이터에 액세스 할 수 있습니다.

Apache Hive에 그래픽 사용자 인터페이스 (GUI)를 제공하는 색조로 알려진 또 다른 웹 브라우저 기술이 있습니다. 일부 Hadoop 사용자는 명령 줄 인터페이스 (CLI) 대신 GUI를 마음대로 사용할 수 있습니다. Hue와 함께 Hue는 HDFS, MapReduce / YARN, HBase, Zookeeper, Oozie, Pig 및 Sqoop과 같은 다른 주요 Hadoop 기술을 지원합니다. Hue의 Apache Hive GUI의 이름을 좋아할 것입니다. Beeswax라고합니다.

Apache Hive의 아키텍처 - Dummy

편집자의 선택

행사에서 연설을 신청하는 방법 - 인형

행사에서 연설을 신청하는 방법 - 인형

강연을 제안 할 수 있어야합니다 다른 잠재적 인 연사보다 이벤트 참석자에게 더 많은 가치를 제공 할 수 있음을 입증하십시오. 연설 인재 풀은 가능한 연설 기회 수보다 빠르게 증가하고 있습니다. 당신은 이벤트 기획자에게 당신이 원하는 바를 물어볼 수있었습니다. ...

새로운 온라인 커뮤니티 회원 유치 방법 - 온라인 커뮤니티의 인형

새로운 온라인 커뮤니티 회원 유치 방법 - 온라인 커뮤니티의 인형

회원은 일시적입니다. 많은 사람들은 그들이 특정한 목표를 성취 할 때까지 주변에 머물러 있습니다. 다른 사람들은 관심을 잃고 새로운 행 아웃을 찾습니다. 따라서 정기적으로 신입 회원을 영입하지 않으면 커뮤니티가 사라집니다. 사람들이 교류 할 수있는 장소를 마련하는 데 어려움을 겪고 있습니다.

엄마 블로거로서 언론의 관심을 끄는 방법 - 인형

엄마 블로거로서 언론의 관심을 끄는 방법 - 인형

수십만 (또는 수백만)의 사람들이 엄청난 성과를 거두고 있습니다. 예상대로, 쉽게 성취되지는 않습니다. 뉴욕 타임스에 언급되거나 투데이 쇼에 출연하기 위해서는 많은 시간과 노력과 신뢰가 필요합니다. 아마도 ...

편집자의 선택

Ning 사용자 기고에 대한 코멘트 방법 - 인형

Ning 사용자 기고에 대한 코멘트 방법 - 인형

Ning 계정에 로그인하면 다른 Ning 사용자의 블로그 게시물, 회신 한 이벤트, 사진 및 비디오에 대한 의견을 남깁니다. 회원님의 논평 벽에 남긴 댓글, 순수 텍스트, 다른 웹 사이트 링크 및 퍼간 동영상과 같은 요소가 귀하의 댓글에 포함될 수 있습니다 ...

닝 네트워크의 광고 제어 방법 - 덤프

닝 네트워크의 광고 제어 방법 - 덤프

기본적으로 닝 네트워크는 애드 센스 광고는 오른쪽 열에 있습니다. 누군가 광고를 클릭하면 생성 된 모든 수익이 Ning으로 이동합니다. 네트워크에서 광고를 게재하여 수익을 얻고 싶거나 광고를 전혀 원하지 않는 경우 제어 광고 프리미엄 서비스를 구입해야합니다.

Ning에서 그룹을 만드는 방법 - Dingy

Ning에서 그룹을 만드는 방법 - Dingy

Ning에서 새로운 그룹을 시작하는 것은 가장 멋진 방법 중 하나입니다. 네가 닝 네트워크에서 할 수있는 일. 그룹을 만들 수 있도록 네트워크가 설정되어 있다면 다음 단계를 따르십시오.

편집자의 선택

Canon Rebel T3 시리즈 카메라로 원시 이미지 파일 처리하기 - 더미 파일

Canon Rebel T3 시리즈 카메라로 원시 이미지 파일 처리하기 - 더미 파일

Canon Rebel T3 또는 T3i로 촬영 한 이미지를 원시 데이터로 캡처 할 수 있습니다. Canon 소프트웨어를 사용하는 경우 Raw 파일을 즉시 인쇄 할 수는 있지만 인쇄하기 전에 사진 작업실로 가져 가서 온라인으로 공유하거나 사진 소프트웨어에서 편집 할 수 있습니다.

Canon Rebel T3 시리즈 카메라에서 자동 초점 포인트 설정 - 인형

Canon Rebel T3 시리즈 카메라에서 자동 초점 포인트 설정 - 인형

Canon Rebel T3 또는 T3i를 사용하는 스포츠 모드에서는 카메라가 중심 초점 위치에 초점을 둡니다. Creative 자동 및 A-DEP 모드뿐만 아니라 다른 완전 자동 노출 모드 (장면 인텔리전스 자동, 인물, 풍경 등)에서 카메라의 자동 초점 시스템은 9 개의 자동 초점을 모두 찾습니다 ...