개인 재정 빅 데이터 아키텍처 관리 - 인형

빅 데이터 아키텍처 관리 - 인형

차례:

비디오: Cloudera - 차세대 빅데이터 스토리지 솔루션 (feat.Kudu) 2024

비디오: Cloudera - 차세대 빅데이터 스토리지 솔루션 (feat.Kudu) 2024
Anonim

귀사의 거대한 데이터 아키텍처는 귀사의 지원 인프라와 함께 수행해야합니다. 예를 들어, 온도, 염분, 퇴적물 재현 등의 실시간 데이터와 기타 생물학적, 화학적 및 물리적 속성의 호스트가있는 해양 지역의 석유를 드릴하는 것이 안전한지 여부를 결정하기 위해 모델을 실행하는 데 관심이있을 수 있습니다. 물줄기.

기존 서버 구성을 사용하여이 모델을 실행하는 데 며칠이 걸릴 수 있습니다. 그러나 분산 컴퓨팅 모델을 사용하면 몇 일이 걸릴 수 있습니다.

성능으로 인해 데이터베이스의 종류가 결정될 수도 있습니다. 예를 들어 어떤 상황에서는 매우 다른 두 개의 데이터 요소가 어떻게 관련되어 있는지 이해하고 싶을 수 있습니다. 소셜 네트워크에서 윙윙 거리는 소리와 판매 성장 사이의 관계는 무엇입니까? 이것은 구조화 된 관계형 데이터베이스에 대해 요청할 수있는 일반적인 쿼리가 아닙니다.

그래프 데이터베이스는 "노드"또는 엔티티를 "속성"또는 엔티티를 정의하는 정보와 노드 및 속성 간의 "에지"또는 관계를 분리하도록 특별히 설계되었으므로 더 나은 선택 일 수 있습니다. 올바른 데이터베이스를 사용하면 성능도 향상됩니다. 일반적으로 그래프 데이터베이스는 과학 및 기술 응용 프로그램에 사용됩니다.

다른 중요한 운영 데이터베이스 접근법은 정보를 행이 아닌 열에 효율적으로 저장하는 원주 형 데이터베이스를 포함합니다. 이 접근법은 입력 / 출력이 매우 빠르기 때문에 더 빠른 성능을 제공합니다. 지리 데이터 저장소가 방정식의 일부인 경우 공간 데이터베이스는 공간에서 개체가 관련되는 방식에 따라 데이터를 저장하고 쿼리하도록 최적화되어 있습니다.

대용량 데이터 서비스 및 도구 구성

조직에서 사용하는 모든 데이터가 작동하는 것은 아닙니다. 점점 더 많은 양의 데이터가 기계 또는 센서 및 대량의 공개 및 비공개 데이터 소스에서 비롯되는 데이터를 비롯하여 매우 체계적이지 않거나 직관적이지 않은 다양한 출처에서 비롯됩니다. 과거에는 대부분의 회사가이 방대한 양의 데이터를 캡처하거나 저장할 수 없었습니다. 그것은 단순히 너무 비싸거나 너무 압도적이었습니다.

기업이 데이터를 수집 할 수 있다고하더라도 데이터를 수집 할 수있는 도구가 없었습니다. 이 방대한 양의 데이터를 이해할 수있는 도구는 거의 없습니다. 존재했던 도구는 사용하기가 복잡했고 적절한 시간 내에 결과를 산출하지 못했습니다.

결국이 데이터를 분석하기 위해 많은 노력을 기울이고 자했던 사람들은 데이터의 스냅 샷 작업을해야했습니다.이는 특정 스냅 샷에 없기 때문에 중요한 이벤트를 누락시키는 바람직하지 않은 영향을 미칩니다.

큰 데이터를위한 MapReduce, Hadoop 및 Big Table

컴퓨팅 기술의 진화로 막대한 양의 데이터를 관리 할 수있게되었습니다. 시스템 가격이 하락하여 결과적으로 분산 컴퓨팅을위한 새로운 기술이 주류를 이루었습니다. 진정한 돌파구는 야후!, Google 및 Facebook은 그들이 만든 대량의 데이터로 수익을 창출하는 데 도움이 필요하다는 사실을 깨닫게되었습니다. 이 신흥 기업은 거대한 양의 데이터를 거의 실시간으로 저장, 액세스 및 분석 할 수있는 새로운 기술을 찾아야 네트워크의 참가자에 관한 많은 데이터를 소유함으로써 얻을 수있는 이점을 얻을 수있었습니다.

그 결과로 나온 솔루션은 데이터 관리 시장을 변화시키고 있습니다. 특히 혁신적인 MapReduce, Hadoop 및 Big Table은 차세대 데이터 관리를 이끌어 냈습니다. 이러한 기술은 가장 근본적인 문제 중 하나 인 대량의 데이터를 효율적이고 비용 효율적으로 적시에 처리 할 수있는 기능을 처리합니다.

MapReduce

MapReduce는 배치 모드에서 많은 양의 데이터에 대해 일련의 기능을 효율적으로 실행하는 방법으로 Google에서 설계했습니다. "맵"구성 요소는 프로그래밍 문제 또는 여러 작업을 여러 시스템에 분산시키고 작업 배치를 처리합니다. 또한로드 균형을 조정하고 장애 복구를 관리합니다. "reduce"라는 또 다른 함수는 모든 요소를 ​​다시 집계하여 결과를 제공합니다.

Big Table

Big Table은 Google에서 확장 성이 뛰어난 구조화 된 데이터를 관리하기위한 분산 저장 시스템으로 개발되었습니다. 데이터는 행과 열이있는 테이블로 구성됩니다. 기존의 관계형 데이터베이스 모델과 달리 Big Table은 분산되고 영구적 인 다차원 소트 맵입니다. 그것은 범용 서버에 방대한 양의 데이터를 저장하기위한 것입니다.

Hadoop

Hadoop은 MapReduce 및 Big Table에서 파생 된 Apache 관리 소프트웨어 프레임 워크입니다. Hadoop을 사용하면 MapReduce를 기반으로하는 응용 프로그램을 상용 하드웨어의 대형 클러스터에서 실행할 수 있습니다. 이 프로젝트는 Yahoo!를 지원하는 컴퓨팅 아키텍처의 기초입니다. 의 사업. Hadoop은 컴퓨팅 노드에서 데이터 처리를 병렬 처리하여 계산 속도를 높이고 대기 시간을 숨길 수 있도록 설계되었습니다.

페어 바이트 단위의 데이터를 지원할 수있는 대규모 확장형 분산 파일 시스템과 결과를 일괄 적으로 계산하는 대규모 확장형 MapReduce 엔진의 두 가지 주요 구성 요소가 있습니다.

빅 데이터 아키텍처 관리 - 인형

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...