비디오: 빅데이터 017 빅데이터 수집 저장 처리 SW 2024
큰 데이터에서 그래프 데이터베이스의 기본 구조를 "노드 관계"라고합니다. "이 구조는 상호 연결된 데이터를 처리해야 할 때 가장 유용합니다. 노드 및 관계는 데이터가 저장되는 속성 , 키 - 값 쌍을 지원합니다.
이러한 데이터베이스는 관계를 따라 이동합니다. 이러한 종류의 저장 및 탐색은 RDBMS (관계형 데이터베이스 관리 시스템)에서 가능하지 않습니다. 이는 테이블 구조가 강하고 어디에서든지 데이터 연결을 추적 할 수 없기 때문입니다. 그래프 데이터베이스는 석유 탐사를위한 지리 데이터를 관리하거나 통신 업체의 네트워크를 모델링하고 최적화하는 데 사용될 수 있습니다.
가장 널리 사용되는 그래프 데이터베이스 중 하나는 Neo4J입니다. 이것은 GNU 공개 라이센스 v3 하에서 라이센스가 부여 된 오픈 소스 프로젝트입니다. 0. 지원되는 상용 버전은 Neo Technology에서 GNU AGPL v3으로 제공됩니다. 0 및 상업 라이센스.
Neo4J는 클러스터링을 통해 고 가용성을 제공하는 ACID 트랜잭션 데이터베이스입니다. 그것은 노드 관계 속성의 기본 구조와 어떻게 자연스럽게 그것이 인간 관계에 매핑되어 있기 때문에 모델링하기 쉽고 신뢰할 수 있고 확장 가능한 데이터베이스입니다. 스키마가 필요 없으며 데이터 유형 지정이 필요 없기 때문에 본질적으로 매우 유연합니다.
이러한 유연성에는 몇 가지 한계가 있습니다. 노드는 자신을 직접 참조 할 수 없습니다. 예를 들어, 당신 (노드로서)은 자신의 아버지 또는 어머니 (관계로서) 일 수는 없지만, 당신은 아버지 또는 어머니가 될 수 있습니다. 자체 참조가 필요한 실제 사례가있을 수 있습니다. 그렇다면 그래프 데이터베이스는 자체 참조에 대한 규칙이 엄격히 적용되므로 최상의 솔루션이 아닙니다. 복제 기능이 매우 뛰어나지 만 Neo4J는 전체 그래프를 복제 할 수 있기 때문에 그래프의 전체 크기 (약 340 억 개의 노드와 340 억 개의 관계)에 한계가 있습니다.
탄력성:
Neo4J는 고 가용성 클러스터링 모드는 물론 콜드 (데이터베이스가 실행되지 않을 때) 및 핫 (실행 중일 때) 백업을 지원합니다.표준 경고는 기존 운영 관리 시스템과의 통합을 위해 사용할 수 있습니다.쿼리 언어:
-
Neo4J는 쿼리 그래프 및 해당 구성 요소를 위해 특별히 설계된 Cypher라는 선언적 언어를 지원합니다. Cypher 명령은 느슨하게 SQL 구문을 기반으로하며 그래프 데이터의 임시 쿼리를 대상으로합니다. Neo4J 구현은
-
소셜 네트워킹 생물 또는 의학 분야 분류
-
실습 또는 관심 동적 커뮤니티 만들기