개인 재정 빅 데이터 아키텍처 관리 - 인형

빅 데이터 아키텍처 관리 - 인형

차례:

비디오: Cloudera - 차세대 빅데이터 스토리지 솔루션 (feat.Kudu) 2024

비디오: Cloudera - 차세대 빅데이터 스토리지 솔루션 (feat.Kudu) 2024
Anonim

귀사의 거대한 데이터 아키텍처는 귀사의 지원 인프라와 함께 수행해야합니다. 예를 들어, 온도, 염분, 퇴적물 재현 등의 실시간 데이터와 기타 생물학적, 화학적 및 물리적 속성의 호스트가있는 해양 지역의 석유를 드릴하는 것이 안전한지 여부를 결정하기 위해 모델을 실행하는 데 관심이있을 수 있습니다. 물줄기.

기존 서버 구성을 사용하여이 모델을 실행하는 데 며칠이 걸릴 수 있습니다. 그러나 분산 컴퓨팅 모델을 사용하면 몇 일이 걸릴 수 있습니다.

성능으로 인해 데이터베이스의 종류가 결정될 수도 있습니다. 예를 들어 어떤 상황에서는 매우 다른 두 개의 데이터 요소가 어떻게 관련되어 있는지 이해하고 싶을 수 있습니다. 소셜 네트워크에서 윙윙 거리는 소리와 판매 성장 사이의 관계는 무엇입니까? 이것은 구조화 된 관계형 데이터베이스에 대해 요청할 수있는 일반적인 쿼리가 아닙니다.

그래프 데이터베이스는 "노드"또는 엔티티를 "속성"또는 엔티티를 정의하는 정보와 노드 및 속성 간의 "에지"또는 관계를 분리하도록 특별히 설계되었으므로 더 나은 선택 일 수 있습니다. 올바른 데이터베이스를 사용하면 성능도 향상됩니다. 일반적으로 그래프 데이터베이스는 과학 및 기술 응용 프로그램에 사용됩니다.

다른 중요한 운영 데이터베이스 접근법은 정보를 행이 아닌 열에 효율적으로 저장하는 원주 형 데이터베이스를 포함합니다. 이 접근법은 입력 / 출력이 매우 빠르기 때문에 더 빠른 성능을 제공합니다. 지리 데이터 저장소가 방정식의 일부인 경우 공간 데이터베이스는 공간에서 개체가 관련되는 방식에 따라 데이터를 저장하고 쿼리하도록 최적화되어 있습니다.

대용량 데이터 서비스 및 도구 구성

조직에서 사용하는 모든 데이터가 작동하는 것은 아닙니다. 점점 더 많은 양의 데이터가 기계 또는 센서 및 대량의 공개 및 비공개 데이터 소스에서 비롯되는 데이터를 비롯하여 매우 체계적이지 않거나 직관적이지 않은 다양한 출처에서 비롯됩니다. 과거에는 대부분의 회사가이 방대한 양의 데이터를 캡처하거나 저장할 수 없었습니다. 그것은 단순히 너무 비싸거나 너무 압도적이었습니다.

기업이 데이터를 수집 할 수 있다고하더라도 데이터를 수집 할 수있는 도구가 없었습니다. 이 방대한 양의 데이터를 이해할 수있는 도구는 거의 없습니다. 존재했던 도구는 사용하기가 복잡했고 적절한 시간 내에 결과를 산출하지 못했습니다.

결국이 데이터를 분석하기 위해 많은 노력을 기울이고 자했던 사람들은 데이터의 스냅 샷 작업을해야했습니다.이는 특정 스냅 샷에 없기 때문에 중요한 이벤트를 누락시키는 바람직하지 않은 영향을 미칩니다.

큰 데이터를위한 MapReduce, Hadoop 및 Big Table

컴퓨팅 기술의 진화로 막대한 양의 데이터를 관리 할 수있게되었습니다. 시스템 가격이 하락하여 결과적으로 분산 컴퓨팅을위한 새로운 기술이 주류를 이루었습니다. 진정한 돌파구는 야후!, Google 및 Facebook은 그들이 만든 대량의 데이터로 수익을 창출하는 데 도움이 필요하다는 사실을 깨닫게되었습니다. 이 신흥 기업은 거대한 양의 데이터를 거의 실시간으로 저장, 액세스 및 분석 할 수있는 새로운 기술을 찾아야 네트워크의 참가자에 관한 많은 데이터를 소유함으로써 얻을 수있는 이점을 얻을 수있었습니다.

그 결과로 나온 솔루션은 데이터 관리 시장을 변화시키고 있습니다. 특히 혁신적인 MapReduce, Hadoop 및 Big Table은 차세대 데이터 관리를 이끌어 냈습니다. 이러한 기술은 가장 근본적인 문제 중 하나 인 대량의 데이터를 효율적이고 비용 효율적으로 적시에 처리 할 수있는 기능을 처리합니다.

MapReduce

MapReduce는 배치 모드에서 많은 양의 데이터에 대해 일련의 기능을 효율적으로 실행하는 방법으로 Google에서 설계했습니다. "맵"구성 요소는 프로그래밍 문제 또는 여러 작업을 여러 시스템에 분산시키고 작업 배치를 처리합니다. 또한로드 균형을 조정하고 장애 복구를 관리합니다. "reduce"라는 또 다른 함수는 모든 요소를 ​​다시 집계하여 결과를 제공합니다.

Big Table

Big Table은 Google에서 확장 성이 뛰어난 구조화 된 데이터를 관리하기위한 분산 저장 시스템으로 개발되었습니다. 데이터는 행과 열이있는 테이블로 구성됩니다. 기존의 관계형 데이터베이스 모델과 달리 Big Table은 분산되고 영구적 인 다차원 소트 맵입니다. 그것은 범용 서버에 방대한 양의 데이터를 저장하기위한 것입니다.

Hadoop

Hadoop은 MapReduce 및 Big Table에서 파생 된 Apache 관리 소프트웨어 프레임 워크입니다. Hadoop을 사용하면 MapReduce를 기반으로하는 응용 프로그램을 상용 하드웨어의 대형 클러스터에서 실행할 수 있습니다. 이 프로젝트는 Yahoo!를 지원하는 컴퓨팅 아키텍처의 기초입니다. 의 사업. Hadoop은 컴퓨팅 노드에서 데이터 처리를 병렬 처리하여 계산 속도를 높이고 대기 시간을 숨길 수 있도록 설계되었습니다.

페어 바이트 단위의 데이터를 지원할 수있는 대규모 확장형 분산 파일 시스템과 결과를 일괄 적으로 계산하는 대규모 확장형 MapReduce 엔진의 두 가지 주요 구성 요소가 있습니다.

빅 데이터 아키텍처 관리 - 인형

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...