차례:
- 큰 데이터를위한 MongoDB
- 매우 인기있는 비 관계형 데이터베이스는 CouchDB이다. MongoDB와 마찬가지로 CouchDB는 오픈 소스이다. 이것은 Apache Software Foundation에서 관리하며 Apache License v2에서 사용할 수 있습니다. 0 MongoDB와는 달리 CouchDB는 모든면에서 웹을 모방하도록 설계되었습니다.
비디오: MongoDB 프로그래밍 1강 클라우드/빅데이터란 무엇인가? | T아카데미 2024
빅 데이터 프로젝트를위한 두 종류의 문서 데이터베이스를 찾습니다. 하나는 전체 문서 스타일 콘텐츠를 저장하는 곳으로 종종 설명됩니다. 다른 하나는 정적 엔티티 또는 문서 부분의 동적 어셈블리로서 영구 저장을 위해 문서 구성 요소를 저장하기위한 데이터베이스입니다. 문서 및 해당 부분의 구조는 JavaScript Object Notation (JSON) 및 / 또는 Binary JSON (BSON)에 의해 제공됩니다.
문서 데이터베이스는 많은 보고서를 작성해야 할 때 가장 유용하며 자주 변경되는 요소에서 동적으로 작성해야합니다.
JSON은 JavaScript 프로그래밍 언어의 하위 집합을 기반으로하는 데이터 교환 형식입니다. 프로그래밍 언어의 일부이긴하지만, 본질적으로 텍스트이고 읽고 쓰는 것이 매우 쉽습니다. 또한 컴퓨터가 쉽게 처리 할 수 있다는 이점이 있습니다. JSON에는 두 가지 기본 구조가 있으며, 전부는 아니더라도 많은 최신 프로그래밍 언어에서 지원됩니다.
첫 번째 기본 구조는 이름 / 값 쌍의 모음이며 개체, 레코드, 키 목록 등으로 프로그래밍 방식으로 표시됩니다. 두 번째 기본 구조는 정렬 된 값 목록이며 배열, 목록 또는 시퀀스로 프로그래밍 방식으로 표시됩니다. BSON은 성능과 확장 성을 높이기 위해 설계된 JSON 구조의 이진 직렬화입니다.
큰 데이터를위한 MongoDB
MongoDB는 "hu (mongo) us database"시스템의 프로젝트 이름입니다. 오픈 소스로 10gen이라는 회사에서 관리하며 GNU AGPL v3에서 무료로 사용할 수 있습니다. 0 라이센스. 10gen에서 완전 지원되는 상용 라이센스를 사용할 수 있습니다.
MongoDB는 "콜렉션"을 포함하는 데이터베이스로 구성됩니다. "컬렉션은"문서 "로 구성되며 각 문서는 필드로 구성됩니다. 관계형 데이터베이스에서와 마찬가지로 컬렉션을 인덱싱 할 수 있습니다.
그렇게하면 데이터 조회의 성능이 향상됩니다. 그러나 다른 데이터베이스와는 달리 MongoDB는 데이터에 대한 포인터 역할을하는 "커서"라는 것을 반환합니다. 이것은 추출하지 않고 데이터를 세거나 분류하는 옵션을 제공하기 때문에 매우 유용한 기능입니다. 기본적으로 MongoDB는 JSON 문서의 바이너리 구현 인 BSON을 지원합니다.
MongoDB는 또한 다음 요소로 구성된 생태계입니다.
-
로컬 및 광역 네트워크에서 확장을위한 고 가용성 및 복제 서비스.
-
큰 문서를 여러 문서로 나누어 저장하는 그리드 기반의 파일 시스템.
-
MapReduce는 다양한 콜렉션 / 문서의 분석 및 집계를 지원합니다.
-
하나 또는 여러 개의 데이터 센터에있는 서버 클러스터에 단일 데이터베이스를 배포하는 샤딩 서비스입니다. 이 서비스는 샤드 키로 구동됩니다. 샤드 키는 여러 인스턴스에 문서를 지능적으로 배포하는 데 사용됩니다.
-
임시 쿼리, 분산 쿼리 및 전체 텍스트 검색을 지원하는 쿼리 서비스입니다.
효과적인 MongoDB 구현은 대량의 컨텐츠 관리
-
소셜 네트워킹
-
아카이빙
-
실시간 분석
-
큰 데이터를위한 CouchDB
매우 인기있는 비 관계형 데이터베이스는 CouchDB이다. MongoDB와 마찬가지로 CouchDB는 오픈 소스이다. 이것은 Apache Software Foundation에서 관리하며 Apache License v2에서 사용할 수 있습니다. 0 MongoDB와는 달리 CouchDB는 모든면에서 웹을 모방하도록 설계되었습니다.
예를 들어, CouchDB는 네트워크 드롭 아웃에 복원력이 있으며 네트워크 연결이 불안정한 지역에서도 계속 아름답게 작동합니다. 스마트 폰이나 데이터 센터에서도 집에 있습니다. 이 모든 것은 몇 가지 단점이 있습니다. 기본 웹 흉내 내기 때문에 CouchDB는 대기 시간이 길어 로컬 데이터 저장을 선호합니다.
CouchDB는 소규모 구현에는 적합하지 않습니다. 빅 데이터 구현을 시작할 때 이러한 절충 사항을 무시할 수 있는지 여부를 결정해야합니다.
CouchDB 데이터베이스는 필드와 첨부 파일로 구성된 문서와 시스템에 의해 자동으로 유지 관리되는 메타 데이터 형식의 문서에 대한 "설명"으로 구성됩니다. 기본 기술은 모든 ACID 기능을 갖추고 있습니다. 관계형 CouchDB의 장점은 데이터가 패키지되고 행이나 테이블에 흩어져있는 것이 아니라 조작이나 저장이 가능한 것입니다.
CouchDB는 또한 다음과 같은 기능을 갖춘 생태계입니다.
압축:
-
빈 공간이 없어지면 낭비되는 공간을 없애기 위해 데이터베이스가 압축됩니다. 이는 지속성을위한 성능 및 효율성을 향상시킵니다. 모델보기:
-
데이터베이스에 문서로 저장되는 정의 집합을 활용하여 데이터를 필터링, 구성 및보고하는 메커니즘입니다. 뷰에 대한 데이터베이스의 일대 다 관계를 찾을 수 있으므로 "슬라이스 및 분할 된"데이터를 표현하는 다양한 방법을 만들 수 있습니다. " 복제 및 분산 서비스:
-
문서 저장소는 양방향 복제를 제공하도록 설계되었습니다. 제한된 연결성이있는 장치로 기준 기반 배포 또는 마이그레이션을 지원하기 위해 부분 복제본을 유지 관리 할 수 있습니다. 원시 복제는 피어 기반이지만 마스터 / 슬레이브, 마스터 / 마스터 및 다른 유형의 복제 방식을 구현할 수 있습니다. 효과적인 CouchDB 구현에는
대량 컨텐트 관리
-
스마트 폰에서 데이터 센터로 확장
-
네트워크 연결이 제한적이거나 느린 응용 프로그램