비디오: 빅데이터 031 빅데이터 분산 처리 2024
NoSQL (not-only-SQL) 데이터베이스 중 가장 단순한 것 큰 데이터 환경에서 키 - 값 쌍 (KVP) 모델을 사용하는 사용자가 있습니다. KVP 데이터베이스는 RDBMS와 같은 스키마를 필요로하지 않으며 뛰어난 유연성과 확장 성을 제공합니다.
KVP 데이터베이스는 ACID (Atomicity, Consistency, Isolation, Durability) 기능을 제공하지 않으며 구현자가 기술 자체에 의해 명시 적으로 제어되지 않기 때문에 데이터 배치, 복제 및 내결함성을 고려해야합니다. KVP 데이터베이스는 입력되지 않습니다. 결과적으로 대부분의 데이터는 문자열로 저장됩니다.
값. 큰 데이터 구현에서는 많은 사람들이 색상, libations 및 영웅에 대한 서로 다른 아이디어를 갖습니다.
키 | 값 |
---|---|
FacebookUser12345_Color | 빨간색 |
TwitterUser67890_Color | 갈색 |
FoursquareUser45678_Libation | "화이트 와인" |
Google + User24356_Libation | " |
LinkedInUser87654_Hero | "최고의 판매 실적 " |
사용자 수가 증가함에 따라 정확한 키와 관련 값을 추적하는 것은 어려울 수 있습니다. 수백만 명의 사용자 의견을 추적해야하는 경우 키 - 값 쌍의 수가 기하 급수적으로 증가 할 수 있습니다. 값의 선택을 제한하지 않으려는 경우 KVP의 일반 문자열 표현은 융통성과 가독성을 제공합니다.
키 - 값 데이터베이스에서 데이터를 구성하는 데 도움이 필요할 수 있습니다. 대부분은 키 (및 관련 값)를 콜렉션에 집계하는 기능을 제공합니다. 컬렉션은 원하는 수의 키 - 값 쌍으로 구성 될 수 있으며 개별 KVP 요소를 독점적으로 제어 할 필요가 없습니다.
널리 사용되는 오픈 소스 키 - 값 쌍 데이터베이스 중 하나가 Riak입니다. Basho Technologies라는 회사에서 개발하고 지원하며 Apache Software License v2에서 사용할 수 있습니다. 0. 999 Riak은 키 - 값 데이터베이스의 매우 빠르고 확장 가능한 구현입니다. 가볍기 때문에 데이터가 빠르게 변경되는 대용량 환경을 지원합니다. Riak은 금융 서비스 거래 실시간 분석에 특히 효과적입니다. 그것은 "버킷"을 키와 값의 집합을 구성하는 메커니즘으로 사용합니다. Riak 구현은 피어 - 투 - 피어 방식으로 배열 된 물리적 또는 가상 노드의 클러스터이다. 마스터 노드가 없기 때문에 클러스터는 탄력성과 확장 성이 뛰어납니다.모든 데이터 및 작업은 클러스터 전체에 분산됩니다. 더 큰 클러스터는 더 적은 노드를 가진 클러스터보다 더 빠르고 더 잘 수행됩니다. 클러스터의 통신은 Gossip이라는 특수 프로토콜을 통해 구현됩니다. Gossip은 클러스터에 대한 상태 정보를 저장하고 버킷에 대한 정보를 공유합니다.
Riak은 많은 기능을 갖추고 있으며 다음과 같은 생태계의 일부입니다:
병렬 처리: MapReduce를 사용하여 Riak은 실시간 분석 및 계산을 위해 클러스터에서 쿼리를 분해하고 재구성하는 기능을 지원합니다.
링크 및 링크 워킹:
-
링크를 사용하여 그래프 데이터베이스를 모방하도록 Riak을 구성 할 수 있습니다. 링크는 키 - 값 쌍 사이의 단방향 연결로 간주 될 수 있습니다. 링크를 따라 가면 키 - 값 쌍 사이의 관계 맵이 제공됩니다. 검색:
-
Riak Search는 내결함성이있는 전체 텍스트 검색 기능을 제공합니다. 버킷은 키 값의 신속한 해결을 위해 인덱싱 할 수 있습니다. 2 차 인덱스:
-
개발자는 하나 이상의 키 필드 값으로 태그를 지정할 수 있습니다. 그런 다음 응용 프로그램은 인덱스를 쿼리하고 일치하는 키 목록을 반환 할 수 있습니다. 이것은 대규모 데이터 구현에서 매우 유용 할 수 있습니다. 그 이유는 조작이 원자 적이며 실시간 동작을 지원하기 때문입니다. Riak 구현은 소셜 네트워크, 커뮤니티 또는 게임의
-
사용자 데이터에 가장 적합합니다. 대량의 풍부한 미디어 데이터 수집 및 저장
RDBMS 및 NoSQL 데이터베이스 연결을위한 캐싱 계층
-
유연성과 신뢰성을 요구하는 모바일 애플리케이션