비디오: 빅데이터 개념 정리, 하둡 파일 시스템 (HDFS)의 탄생 배경 2024
NoSQL 데이터 스토어는 원래 "Just Say No to SQL"이라는 개념에 가입했습니다 (1980 년대의 마약 방지 광고 캠페인), 그들은 (SQL 기반의) 관계형 데이터베이스의 인식 된 한계에 대한 반작용이었다. 이 사람들이 SQL을 싫어하는 것은 아니지만 관계형 데이터베이스가 설계되지 않은 문제를 해결하여 사각형 구멍을 둥근 구멍으로 밀어 넣는 일에 지쳐있었습니다.
카테고리에 맞는 많은 데이터베이스가 "NoSQL"지원이 아닌 SQL 지원을 가지고 있기 때문에 NoSQL이라는 이름이 다소 오도 된 것입니다. 대신 그 이름을 "Not Only SQL"이라고 생각하십시오. "
열 패밀리 저장:
열을 열 패밀리로 그룹화하고 함께 디스크에 저장하는 데이터베이스가 있습니다.
-
엄밀히 말하자면, 이들 데이터베이스의 대부분은 데이터를 다차원 정렬 맵으로 저장하는 Google의 BigTable 종이를 기반으로하기 때문에 열 지향적이지 않습니다. 문서 저장소:
이 제품은 효율성을 높이기 위해 유사하게 인코딩되고 형식이 지정된 문서 모음을 사용합니다.문서 저장소를 사용하면 컬렉션의 개별 문서에 필드 하위 집합 만 포함 할 수 있으므로 필요한 데이터 만 저장됩니다. 많은 필드에 데이터가 채워지지 않는 스파 스 데이터 세트의 경우 이는 공간을 크게 절약 할 수 있습니다. 대조적으로, 관계형 데이터베이스 테이블의 빈 컬럼은 공간을 차지합니다. 문서 저장소는 필요한 필드 만 저장되고 새 필드를 추가 할 수 있기 때문에 스키마 유연성을 가능하게합니다. 또한 관계형 데이터베이스와 달리 데이터가 저장되기 전에 테이블 구조가 정의되고 열 변경은 전체 데이터 세트에 영향을주는 지루한 작업입니다.
-
그래프 데이터베이스: 그래프 구조를 저장하는 데이터베이스가 있습니다.
- 엔티티 (정점 또는 노드)와 그 관계 (에지)를 서로 보여주는 표현입니다. 이러한 구조를 통해 그래프 데이터베이스는 알려진 모든 웹 페이지 간의 연결 관계와 같은 복잡한 구조를 저장하는 데 매우 적합합니다. (예를 들어, 개별 웹 페이지는 노드이며, 이들을 연결하는 가장자리는 한 페이지에서 다른 페이지로 이어지는 링크입니다.)
-
Google은 물론 모든 그래프 기술을 사용하고 있으며 PageRank에 힘을 실어주는 Pregel이라는 그래프 처리 엔진을 발명했습니다 연산. (그리고 예, Pregel에 백서가 있습니다.) Hadoop 커뮤니티에는 HDFS에 저장된 그래프를 처리하도록 설계된 그래프 처리 엔진 인 Giraph (Pregel 논문에 기초한)라는 Apache 프로젝트가 있습니다. Hadoop에서 사용 가능한 데이터 저장 및 처리 옵션은 많은 경우 여기에 나열된 NoSQL 카테고리의 구현입니다. 이를 통해 사용 가능한 솔루션을보다 정확하게 평가하고 Hadoop이 기존의 데이터웨어 하우스를 보완하는 방법을 알 수 있습니다.