차례:
비디오: Hadoop 빅데이터 기술적 환경의 변화 - Oracle Korea 2024
대용량 데이터는 조직이 대량 데이터를 적절한 속도로 활용하여 특정 데이터를 해결하는 방식에서 중요한 요소가되고 있습니다 문제. 관계형 데이터베이스 관리 시스템은이 대량으로 중요합니다. 대용량 데이터는 독립적으로 존재하지 않습니다. 효과적이기 위해 기업은 대용량 데이터 분석 결과를 비즈니스 내에 존재하는 데이터와 결합 할 수 있어야합니다.
큰 데이터 기본: RDBMS 및 영구 데이터
운영 데이터베이스 (" 데이터 저장소 라고도 함)가 제공하는 가장 중요한 서비스 중 하나는 지속성입니다. 지속성은 데이터베이스에 저장된 데이터가 사용 권한없이 변경되지 않으며 비즈니스에 중요한 한 사용할 수 있음을 보장합니다. 데이터베이스에 데이터를 안전하게 보관할 수 없다면 데이터베이스가 무엇이 좋을까요? ->
큰 데이터 기초: RDBMS 및 테이블
관계형 데이터베이스는 하나 이상의 관계를 기반으로하며 테이블로 표시됩니다. 이 테이블은 열에 의해 정의되며 데이터는 행에 저장됩니다. 기본 키는 대개 테이블의 첫 번째 열입니다. 데이터베이스의 일관성과 그 가치의 상당 부분은 데이터를 "정규화"하여 얻을 수 있습니다. 표준화 된 데이터는 기본 형식에서 공유 된 동의 형식으로 변환되었습니다.
예를 들어 한 데이터베이스에서 "전화"가 XXX-XXX-XXXX 일 수 있고 다른 전화는 XXXXXXXXX 일 수 있습니다. 정보를 일관되게 보려면 필드를 다른 형식으로 정규화해야합니다. 표준화를위한 5 가지 수준의 표준이 존재합니다. 일반적인 형태의 선택은 종종 데이터베이스 설계자에게 맡겨집니다. 테이블, 키, 요소 등의 컬렉션을 데이터베이스스키마라고합니다.
구조화 된 쿼리 언어 (SQL)는 RDBMS 기술로 잠금 단계로 진화 해 왔으며 관계형 데이터베이스를 생성, 쿼리, 유지 관리 및 운영하는 데 가장 널리 사용되는 메커니즘입니다.크고 작은 회사의 경우 중요한 운영 정보는 대부분 RDBMS에 저장됩니다. 많은 기업들이 각기 다른 비즈니스 영역에 대해 서로 다른 RDBMS를 보유하고 있습니다. 거래 데이터는 한 공급 업체의 데이터베이스에 저장 될 수 있지만 고객 정보는 다른 공급 업체의 데이터베이스에 저장 될 수 있습니다.
구현의 핵심으로 RDBMS를 사용할 가능성은 없지만 RDBMS에 저장된 데이터를 사용하여 큰 데이터로 비즈니스에 최고 수준의 가치를 창출해야합니다. 오픈 소스 관계형 데이터베이스 인 PostgreSQL
대규모 데이터 구현 중에 널리 사용되는 오픈 소스 관계형 데이터베이스 인 PostgreSQL을 접하게 될 것입니다. PostgreSQL의 인기에 영향을 미치는 몇 가지 요소가 있습니다. SQL 표준을 지원하는 RDBMS로서 데이터베이스 제품에서 기대할 수있는 모든 기능과 수명 및 다양한 용도로 "테스트를 마쳤습니다. "이것은 PC에서 메인 프레임에 이르기까지 거의 모든 운영 체제에서 사용할 수 있습니다.
기초를 제공하고 그렇게 신뢰할 수있게하는 것은 이야기의 일부일뿐입니다.
관계형 스키마 내에서 "객체"를 직접 처리 할 수있는 능력
외래 키 (다른 테이블의 한 테이블에서 키 참조)
트리거 (이벤트
복잡한 쿼리 (별도의 테이블에서 하위 쿼리 및 조인)
-
트랜잭션 무결성
-
다중 회선 동시성 제어
-
PostgreSQL의 진정한 강점은 확장 성입니다. 사용자와 데이터베이스 프로그래머는 데이터베이스의 기본 작동이나 안정성에 영향을주지 않고 새로운 기능을 추가 할 수 있습니다. 가능한 확장에는
-
데이터 유형
-
연산자
-
함수
인덱싱 방법
-
절차 언어
-
엄격한 독점 제품으로 작업을 완료하지 못할 때 높은 수준의 사용자 정의가 요구됩니다. 그것은 무한히 확장 가능합니다.
-
마지막으로 PostgreSQL 라이센스는 오픈 소스 또는 클로즈드 소스와 같은 형태로 수정 및 배포 할 수 있습니다. 수정 사항은 비공개로 유지하거나 원하는대로 커뮤니티와 공유 할 수 있습니다.