비디오: SQL Databases and the Firebase Database - The Firebase Database For SQL Developers #1 2024
Hadoop 데이터에 대한 SQL 액세스를위한 오픈 소스 프로젝트 및 독점 솔루션을 개발하기 위해 많은 회사가 투자하고 있습니다. SQL 액세스, 라는 용어를 듣고 몇 가지 기본 가정을 알아야합니다.
-
언어 표준: 물론 가장 중요한 표준은 언어 자체를 수반합니다. 일반적인 SQL 문조차도 작동하지 못하게하는 방식과 같이 특정 근본적인 방법으로는 대개 측정하지는 않지만 "SQL과 비슷한"많은 솔루션이 존재합니다.
드라이버: -
SQL 액세스 솔루션의 또 다른 주요 구성 요소는 응용 프로그램이 데이터 저장소와 데이터를 연결하고 교환하는 인터페이스 인 드라이버 입니다. 드라이버가 없으면 SQL 쿼리 제출을 위해 연결할 클라이언트 응용 프로그램이나 도구에 대한 SQL 인터페이스가 없습니다. 실시간 액세스:
Hadoop 2가 실행될 때까지 MapReduce 기반 실행은 Hadoop에 저장된 데이터에 대한 분석을위한 유일한 옵션이었습니다. 테이블에서 전체 데이터 스캔과 관련된 비교적 간단한 쿼리의 경우 Hadoop은 전통적인 관계형 데이터베이스와 비교할 때 매우 빠릅니다.
-
-> 이것은 배치 분석 유스 케이스이며, 여기서
패스트는 데이터가 얼마나 많은지에 따라 시간을 의미 할 수 있습니다. 그러나 Hadoop은 데이터 서브 세트를 포함하는보다 복잡한 쿼리를 수행 할 때 적합하지 않았습니다. MapReduce는 일괄 처리 프레임 워크이므로 Hadoop 2 이전의 실시간 쿼리에서 높은 성능을 달성하는 것은 구조적으로 불가능했습니다. 블록에 대한 새로운 자원 관리 및 스케줄링 시스템 인 YARN에 대한 초기 동기 중 하나는 인터랙티브 SQL 쿼리와 같은 실시간 작업로드를 가능하게하는 다른 프로세싱 프레임 워크를 지원해야한다는 필요성이었습니다. 사실, 적절한 SQL 솔루션으로 사람들이 합당한 쿼리를 기다리지 않아야합니다. 변경 가능 데이터:
Hadoop에 대한 SQL 지원과 관련된 많은 논의에서 흔히 볼 수있는 질문은 "일반적인 관계형 데이터베이스에서 할 수있는 것처럼, 및 문을 사용할 수 있습니까? "현재로서는 HDFS의 성격을 반영한 대답은 '아니오'입니다. 이건 대용량의 불변 파일에 초점을 맞추고 있습니다.Hive와 같은 기술은 이러한 파일에 대한 읽기 전용 액세스를 제공합니다. 그럼에도 불구하고 하이브 아파치 프로젝트에서 작업이 진행 중이다.
-