비디오: Summit Seoul '19 T2-4. Blob에서 Table까지: 데이터 저장에 대한 모든 것 (최유정) 2024
큰 데이터 환경의 핵심과 큰 데이터 스택의 2 층에는 귀하의 비즈니스와 관련된 데이터 요소의 모음. 이러한 엔진은 빠르고 확장 가능하며 견고해야합니다. 그것들은 모두 동일하게 만들어지는 것이 아니며 특정 큰 데이터 환경은 한 엔진에서 다른 엔진보다 좋게, 또는 데이터베이스 엔진을 혼합하여 사용하면 더 좋을 것입니다. 예를 들어, 모든 대형 데이터 구현에 관계형 데이터베이스 관리 시스템 (RDBMS)을 사용할 수는 있지만 성능, 규모 또는 비용으로 인해 그렇게하는 것은 실용적이지 않습니다. 다양한 데이터베이스 기술을 사용할 수 있으므로 현명하게 선택해야합니다.
예를 들어, 관계형 모델을 사용하는 경우 SQL을 사용하여 쿼리 할 수 있습니다. 그러나 Python이나 Java와 같은 다른 언어를 사용할 수도 있습니다. 데이터베이스가 조작 할 수있는 데이터의 유형과 실제 트랜잭션 동작을 지원하는지 여부를 이해하는 것은 매우 중요합니다. 데이터베이스 디자이너는이 동작을 머리 글자
ACID로 설명합니다. 이는 원자적일 때 트랜잭션은 "전부 또는 아님"입니다. 트랜잭션 또는 기본 시스템의 일부가 실패하면 전체 트랜잭션이 실패합니다.
-
일관성: 유효한 데이터를 가진 트랜잭션 만 데이터베이스에서 수행됩니다. 데이터가 손상되었거나 부적절한 경우 트랜잭션이 완료되지 않고 데이터가 데이터베이스에 기록되지 않습니다.
-
격리: 여러 개의 동시 트랜잭션이 서로 간섭하지 않습니다. 모든 유효한 트랜잭션은 완료 될 때까지 그리고 처리를 위해 제출 된 순서대로 실행됩니다.
-
-
쿼리 언어 MapReduce
데이터 형식 트랜잭션 예제 관계형 SQL, Python, C 아니요 Ruby Hadoop 미리 정의되고 형식화 된 가능하다면 HBase Graph 걷기, 검색, Cypher 아니요 형식이 지정되지 않은 ACID Neo4J 문서 명령 JavaScript 형식이 지정되지 않음 아니요 MongoDB, CouchDB Lucene, 명령 JavaScript BLOB, semityped 아니요 Riak, Redis 요구 사항을 이해하고 수집 할 데이터, 이를 위해 분석,보고 또는 특정 응용 프로그램에서 사용할 수 있도록 구성해야합니다.