차례:
- ETL 필요성 감소
- 엔터프라이즈 시스템의 대다수 데이터는 체계적이지 않습니다. 많은 NoSQL 데이터베이스는 고유 기능 (MarkLogic Server) 또는 Solr 또는 Elasticsearch를 포함한 통합 서비스 세트 중 하나로서 구조화되지 않은 텍스트의 인덱싱을 처리 할 수 있습니다.
- NoSQL 데이터베이스의 스키마 불가지론 특성으로 인해 시스템 변경 사항을 매우 잘 관리 할 수 있으므로 시스템 간의 XML 메시지 구조가 변경된 경우 ETL 루틴을 다시 작성할 필요가 없습니다.
- SQL (Structured Query Language)은 관계형 데이터베이스 관리 시스템을 쿼리하는 데 사용되는 주요 언어입니다. 쿼리가 잘 수행되도록 구조화 할 수 있다는 것은 지난 수년간 첨예 한 예술이되었습니다. 복잡한 다중 테이블 조인은 메모리에서 쓰는 것이 쉽지 않습니다. 많은 NoSQL 데이터베이스가 SQL 액세스를 지원하지만 비즈니스 인텔리전스 (BI) 도구와 같은 기존 응용 프로그램과의 호환성을 위해 이러한 기능을 제공합니다. NoSQL 데이터베이스는 기본 데이터베이스 내에 관계형 모델이 필요하지 않고 저장된 데이터를 해석 할 수있는 자체 액세스 언어를 지원합니다.
- 샤딩
- 다중 데이터 구조 지원
- 관련 정보 값은 Bigtable 클론 내의 열 패밀리로 그룹화 할 수 있습니다. 매우 복잡한 부모 - 자식 계층 구조는 문서 데이터베이스 내에서 관리 될 수 있습니다. 상호 연관된 정보의 웹은 유연하게 기술 될 수 있고 트리플 및 그래프 저장과 관련 될 수있다.
- NoSQL 데이터베이스는 개발 및 성숙 단계에서 빠른 속도를 보입니다. 새로운 기능이 항상 발표되고 새로운 기능과 기존 기능이 자주 업데이트됩니다 (따라서 NoSQL 공급 업체는 매우 큰 코드 기반을 유지할 필요가 없습니다). 사실 새로운 주요 방출은 3 ~ 5 년마다가 아니라 매년 발생합니다.
- 쿼리 및 처리 작업은 이제 여러 서버로 전달되어 인제 스트 및 쿼리 작업 부하 모두에 대해 높은 수준의 병렬 처리를 제공합니다. 데이터 옆에 집계를 계산할 수 있다는 것도 표준이되었습니다.
비디오: RDBMS, NoSQL DB, Hadoop 비교 분석 - Oracle Korea 2024
NoSQL 데이터베이스는 간단한 데이터 구조를 저장할 수있는 기능을 제공합니다. 그러나 많은 데이터 문제에 대해 NoSQL은 RDBMS보다 더 나은 일치입니다.
ETL 필요성 감소
NoSQL 데이터베이스는 데이터 저장을 지원합니다. "키 값 저장소는 단순한 데이터 구조를 저장할 수있는 기능을 제공하지만 문서 NoSQL 데이터베이스는 다양한 평면 또는 중첩 구조를 처리 할 수있는 기능을 제공합니다.
시스템간에 전송되는 대부분의 데이터는 메시지로 처리됩니다. 일반적으로 데이터는 다음 형식 중 하나를 취합니다.
-
레이어 세트를 통과하는 바이너리 객체
-
XML 문서
-
A JSON 문서
이러한 형식을 네이티브 범위 내에서 처리 할 수 있으므로 NoSQL 데이터베이스는 원본 데이터 형식에서 저장해야하는 형식으로 변환해야하는 코드의 양을 줄입니다. 이것을 추출, 변환 및로드 (ETL)라고합니다.
구조화되지 않은 텍스트 지원
엔터프라이즈 시스템의 대다수 데이터는 체계적이지 않습니다. 많은 NoSQL 데이터베이스는 고유 기능 (MarkLogic Server) 또는 Solr 또는 Elasticsearch를 포함한 통합 서비스 세트 중 하나로서 구조화되지 않은 텍스트의 인덱싱을 처리 할 수 있습니다.
또한 데이터 수집에 검색 경고 조치를 사용하면 사람, 장소 및 조직을 나열하는 디렉토리와 같은 이름이 지정된 항목을 추출 할 수 있으므로 텍스트 데이터의 분류, 태그 지정 및 검색이 더 쉬워집니다.
추출 된 정보를 다른 정보와 결합하는 SmartLogic, OpenCalais, NetOwl 및 TEMIS Luxid와 같은 엔티티 강화 서비스는 풍부한 인터리브 된 정보 웹을 제공하고 효율적인 분석 및 사용을 향상시킵니다.
시간 경과에 따른 변경을 처리 할 수있는 능력
NoSQL 데이터베이스의 스키마 불가지론 특성으로 인해 시스템 변경 사항을 매우 잘 관리 할 수 있으므로 시스템 간의 XML 메시지 구조가 변경된 경우 ETL 루틴을 다시 작성할 필요가 없습니다.
일부 NoSQL 데이터베이스는이를 한 걸음 더 나아가 정보에서 발견되는 구조, 값 및 텍스트에 대한 범용 색인을 제공합니다.Microsoft DocumentDB와 MarkLogic Server는이 기능을 제공합니다.
문서 구조가 변경되면 조직에서는 이러한 색인을 사용하여 시스템을 테스트하고 다시 쓸 수 있기 전에 몇 달 동안 기다리지 않고 즉시 정보를 사용할 수 있습니다.
SQL 매직에 의존하지 않음
SQL (Structured Query Language)은 관계형 데이터베이스 관리 시스템을 쿼리하는 데 사용되는 주요 언어입니다. 쿼리가 잘 수행되도록 구조화 할 수 있다는 것은 지난 수년간 첨예 한 예술이되었습니다. 복잡한 다중 테이블 조인은 메모리에서 쓰는 것이 쉽지 않습니다. 많은 NoSQL 데이터베이스가 SQL 액세스를 지원하지만 비즈니스 인텔리전스 (BI) 도구와 같은 기존 응용 프로그램과의 호환성을 위해 이러한 기능을 제공합니다. NoSQL 데이터베이스는 기본 데이터베이스 내에 관계형 모델이 필요하지 않고 저장된 데이터를 해석 할 수있는 자체 액세스 언어를 지원합니다.
데이터베이스와 액세스 API (Application Programming Interface)의 디자인에 대한 개발자 중심의 생각은 NoSQL 데이터베이스가 애플리케이션 개발자들 사이에서 매우 인기를 얻은 이유입니다.
응용 프로그램 개발자는 데이터베이스를 사용하기 전에 데이터베이스의 내부 동작 및 모호성을 알 필요가 없습니다. NoSQL 데이터베이스는 개발자가 관계형 데이터베이스에 필요한 작업을 수행하는 대신 응용 프로그램에서 필요한 작업을 수행 할 수 있도록합니다.
상용 하드웨어에서 수평 적으로 확장 가능
NoSQL 데이터베이스는 여러 서버에서 데이터베이스 분할 (
샤딩
)을 처리합니다. 따라서 데이터 저장소 요구 사항이 너무 많이 증가하면 저렴한 서버를 계속 추가하여 데이터베이스 클러스터에 연결 ( 수평 확장 )하여 단일 데이터 서비스로 사용할 수 있습니다. 이것은 규모가 큰 새 하드웨어를 구입해야하는 관계형 데이터베이스 환경 (수직 확장 )과 대조됩니다. 저장하는 데이터의 양을 두 배로 늘리려면 필요한 하드웨어 비용을 쉽게 4 배로 늘릴 수 있습니다.
NoSQL의 주요 자산 중 하나는 저렴한 하드웨어 및 스토리지를 사용하여 NoSQL 데이터베이스의 내구성과 고 가용성을 제공하는 것입니다. 많은 용도에 대해 관대 한 확장 성을 제공하면서 그렇게 할 수 있다는 것도 상처를주지 않습니다! 기능의 폭 대부분의 관계형 데이터베이스는 동일한 기능을 약간 다른 방식으로 지원하므로 모두 유사합니다.
NoSQL 데이터베이스는 키 - 값, 컬럼, 문서 및 트리플 스토어의 네 가지 핵심 유형이 있습니다. 이러한 유형 내에서 특정 (및 특이한) 요구에 맞게 데이터베이스를 찾을 수 있습니다. 선택의 폭이 넓어 지므로 응용 프로그램 문제를 해결할 NoSQL 데이터베이스를 찾아야합니다.
다중 데이터 구조 지원
많은 애플리케이션은 단순한 객체 저장을 필요로하는 반면, 다른 것들은 복잡하고 상호 연관된 구조 저장을 필요로합니다. NoSQL 데이터베이스는 다양한 데이터 구조를 지원합니다.
간단한 2 진 값,리스트, 맵 및 문자열은 키 - 값 저장소에서 고속으로 처리 될 수 있습니다.
관련 정보 값은 Bigtable 클론 내의 열 패밀리로 그룹화 할 수 있습니다. 매우 복잡한 부모 - 자식 계층 구조는 문서 데이터베이스 내에서 관리 될 수 있습니다. 상호 연관된 정보의 웹은 유연하게 기술 될 수 있고 트리플 및 그래프 저장과 관련 될 수있다.
벤더 선택
-
많은 사람들이 10 년 미만 동안 있었지만 NoSQL 산업은 데이터베이스가 넘쳐났다. 예를 들어, IBM, Microsoft 및 Oracle은 최근에야이 시장에 발을 들여 놓았습니다. 결과적으로 많은 벤더들은 자신들 만의 혁신을 통해 특정 고객층을 겨냥하고 있습니다.
-
대부분의 NoSQL 데이터베이스에서 Open - source 변형을 사용할 수 있으므로 NoSQL 데이터베이스를 탐색하고 시작할 수 있습니다. 그런 다음이 회사는 엔터프라이즈 오퍼링을 사용하여 새로운 방법을 프로덕션 플랫폼에 적용 할 수 있습니다.
-
레거시 코드 없음
-
NoSQL 데이터베이스는 새로운 기능이므로 레거시 코드가 없으므로 오래된 하드웨어 플랫폼을 지원하거나 이상하고 자주 사용하지 않는 기능을 업데이트하지 않아도됩니다.
NoSQL 데이터베이스는 개발 및 성숙 단계에서 빠른 속도를 보입니다. 새로운 기능이 항상 발표되고 새로운 기능과 기존 기능이 자주 업데이트됩니다 (따라서 NoSQL 공급 업체는 매우 큰 코드 기반을 유지할 필요가 없습니다). 사실 새로운 주요 방출은 3 ~ 5 년마다가 아니라 매년 발생합니다.
데이터 옆에있는 코드 실행
NoSQL 데이터베이스는 Hadoop 시대에 만들어졌습니다. Hadoop의 고도로 분산 된 파일 시스템 (HDFS)과 일괄 처리 환경 (Map / Reduce)은 데이터 저장, 쿼리 및 처리 방식의 변화를 알 렸습니다.
쿼리 및 처리 작업은 이제 여러 서버로 전달되어 인제 스트 및 쿼리 작업 부하 모두에 대해 높은 수준의 병렬 처리를 제공합니다. 데이터 옆에 집계를 계산할 수 있다는 것도 표준이되었습니다.
하룻밤 사이에 업데이트되는 별도의 데이터웨어 하우스 시스템이 더 이상 필요하지 않습니다. 빠른 집계 및 쿼리 처리를 통해 데이터 옆에 실행을 위해 분석이 데이터베이스로 전달되므로 로컬로 결합 된 분석을 수행하기 위해 네트워크 주변에 많은 데이터를 제공 할 필요가 없습니다.