개인 재정 하이브리드 클라우드에서 빅 데이터 기술 관리하기 - 인형

하이브리드 클라우드에서 빅 데이터 기술 관리하기 - 인형

차례:

비디오: [애플리케이션 현대화 및 개발] 클라우드를 통한 현대적 애플리케이션 디자인 및 구축 패턴 - 윤석찬, AWS 수석 테크 에반젤리스트 2024

비디오: [애플리케이션 현대화 및 개발] 클라우드를 통한 현대적 애플리케이션 디자인 및 구축 패턴 - 윤석찬, AWS 수석 테크 에반젤리스트 2024
Anonim

큰 데이터 증가하는 양의 데이터를 지속적으로 처리해야하기 때문에 하이브리드 클라우드 기술의 세계에서 자주 사용됩니다. 큰 데이터에 대한 핵심 사실은 대규모 데이터를 관리하기 위해 조직에서 역사적으로 제기 한 대안의 전환점에 존재한다는 것입니다. 빅 데이터 기술을 통해 사람들은 실제로이 데이터를 효과적으로 분석하고 활용할 수 있습니다.

->

빅 데이터 특성

빅 데이터는 일반적으로 볼륨, 버라이어티 및 속도의 세 가지 특성을 갖습니다.

  • 볼륨: 큰 데이터는 대량입니다. 일반적으로 최소한 여러 테라 바이트의 데이터를 의미합니다. 많은 대형 데이터 구현은 페타 바이트의 정보를 분석하려고합니다. 999 바이트

    테라 바이트 10 999 > 10
    -> -> 다양성: 빅 데이터는 다양한 모양과 크기로 제공됩니다. 여기에는 다음 유형의 데이터가 포함됩니다.
    구조화 된 데이터 는 분석가가 처리하는 데 사용되는 일반적인 종류의 데이터입니다. 여기에는 데이터베이스에 포함시키는 것과 관련하여 생각하는 데이터 유형 및 매출액이 포함됩니다. 구조화 된 데이터는 센서 및 RFID 태그와 같은 제품에서 새로운 방식으로 생산되고 있습니다. 반 구조화 된 데이터
    는 구조가 있지만 데이터베이스의 테이블에 대해서는 생각하지 않습니다. 여기에는 EDI 형식과 XML이 포함됩니다. 비 체계적인 데이터 에는 회사 내부 또는 인터넷 내부의 문서, 전자 메일 메시지, 짹짹 또는 블로그 등 텍스트, 이미지 및 오디오가 포함됩니다. 비 구조적인 데이터는 모든 데이터의 약 80 %를 차지합니다. 속도:
    이것은 데이터가 이동하는 속도입니다. 의료 기기에서 출력되는 밀리 초 단위의 데이터 또는 데이터 스트림을 캡처하는 센서에 대해 생각해보십시오. 대용량 데이터는 스트림에서 사용자에게 전달되는 경우가 많으므로 실시간 데이터가 관련되어 있습니다. 클라우드는 확장 가능한 스토리지, 컴퓨팅 파워 및 탄력적 인 리소스로 인해 큰 데이터에 이상적인 장소입니다. 클라우드 모델은 대규모입니다. Apache Hadoop: Java로 작성된 개방형 소스 분산 컴퓨팅 플랫폼을 포함하여이 모델을 지원하기 위해 여러 가지 프레임 워크와 기술이 등장했습니다. 컴퓨터 클러스터 전체에 분산 처리를 가능하게하는 소프트웨어 라이브러리입니다. 실제로는 분산 파일 시스템입니다. Hadoop 파일 시스템을 가진 컴퓨터 풀을 생성합니다. Hadoop은 많은 양의 복잡한 데이터를 처리하도록 설계되었습니다.데이터는 구조화, 비 구조화 또는 반 구조화 될 수 있습니다. Hadoop은 메모리 또는 디스크를 공유하지 않는 많은 서버에서 실행할 수 있습니다. 자세한 내용은 Hadoop을 참조하십시오.
    MapReduce: 대규모 데이터 집합에서 분산 컴퓨팅을 지원하기 위해 Google에서 도입 한 소프트웨어 프레임 워크입니다. Hadoop은 거대한 데이터와 큰 데이터 분석으로 무엇을하고 있는지 핵심입니다. 클라우드 리소스를 활용하도록 설계되었습니다. 이 계산은 클러스터 라고하는 수많은 컴퓨터에서 수행되며 각 클러스터는
    노드라고합니다.
  • MapReduce는 구조화 된 데이터와 구조화되지 않은 데이터를 모두 처리 할 수 ​​있습니다. 사용자는 키 / 값 쌍을 처리하여 중간 쌍 쌍을 생성하는지도 함수와 이러한 쌍을 병합하는 축소 함수를 지정합니다. 빅 데이터 데이터베이스

    • Hadoop의 한 가지 중요한 매력은 다양한 유형의 데이터를 처리 할 수 ​​있다는 것입니다. 병렬 데이터베이스 관리 시스템은 수십 년 동안 시장에 나와 있습니다. 대부분의 테이블은 클러스터의 노드를 통해 분할되고 SQL 명령을 클러스터의 노드로 분리 된 계획으로 변환 할 수 있으므로 병렬 실행을 지원할 수 있습니다. 그러나 구조화 된 자유 형식 데이터를 관계형 모델의 열과 행에 맞추기가 어렵 기 때문에 대부분 구조화 된 데이터를 처리합니다. Hadoop은 SQL 만 의미하는

      NoSQL,
    • 에서 움직임을 시작했습니다. 이 용어는 관계형 데이터베이스 시스템과는 다른 일련의 기술을 의미합니다. 가장 큰 차이점은 SQL을 사용하지 않는다는 것입니다. 또한 분산 데이터 저장소를 위해 설계되었습니다. NoSQL은 사람들이 SQL을 사용하지 않아야 함을 의미하지는 않습니다. 오히려 문제는 문제가 무엇인지에 따라 관계형 데이터베이스와 NoSQL 데이터베이스가 한 조직에 공존 할 수 있다는 것입니다.

    • Apache Cassandra: 원래 Facebook에서 개발 한 오픈 소스 분산 데이터 관리 시스템. 구조 요구 사항이 엄격하지 않으므로 모든 다른 유형의 데이터를 처리 할 수 ​​있습니다. 전문가들은 대량의 실시간 트랜잭션 처리 기능이 뛰어나다 고 주장합니다. 다른 오픈 소스 데이터베이스로는 MongoDB, Apache CouchDB 및 Apache HBase가 있습니다.

  • Amazon Simple DB: Amazon은이 데이터베이스를 속성 및 항목이 각각 저장된 열과 행이 있다는 점에서이 데이터베이스를 스프레드 시트에 비유합니다. 그러나 스프레드 시트와 달리 각 셀에는 여러 값이있을 수 있으며 각 항목에는 고유 한 속성 집합이있을 수 있습니다. 그러면 Amazon이 자동으로 데이터를 색인화합니다. 최근 아마존은 Cloud에 대규모 데이터 NoSQL을 가져 오는 방법으로 Amazon Dynamo DB를 발표했습니다.

Google BigTable:

  • 이 하이브리드는 일종의 큰 테이블과 같습니다. 테이블은 커질 수 있기 때문에 행 경계에서 테이블로 분할되며 수백 메가 바이트 정도 될 수 있습니다. MapReduce는 BigTable에 저장된 데이터를 생성하고 수정하는 데 자주 사용됩니다.

하이브리드 클라우드에서 빅 데이터 기술 관리하기 - 인형

편집자의 선택

행사에서 연설을 신청하는 방법 - 인형

행사에서 연설을 신청하는 방법 - 인형

강연을 제안 할 수 있어야합니다 다른 잠재적 인 연사보다 이벤트 참석자에게 더 많은 가치를 제공 할 수 있음을 입증하십시오. 연설 인재 풀은 가능한 연설 기회 수보다 빠르게 증가하고 있습니다. 당신은 이벤트 기획자에게 당신이 원하는 바를 물어볼 수있었습니다. ...

새로운 온라인 커뮤니티 회원 유치 방법 - 온라인 커뮤니티의 인형

새로운 온라인 커뮤니티 회원 유치 방법 - 온라인 커뮤니티의 인형

회원은 일시적입니다. 많은 사람들은 그들이 특정한 목표를 성취 할 때까지 주변에 머물러 있습니다. 다른 사람들은 관심을 잃고 새로운 행 아웃을 찾습니다. 따라서 정기적으로 신입 회원을 영입하지 않으면 커뮤니티가 사라집니다. 사람들이 교류 할 수있는 장소를 마련하는 데 어려움을 겪고 있습니다.

엄마 블로거로서 언론의 관심을 끄는 방법 - 인형

엄마 블로거로서 언론의 관심을 끄는 방법 - 인형

수십만 (또는 수백만)의 사람들이 엄청난 성과를 거두고 있습니다. 예상대로, 쉽게 성취되지는 않습니다. 뉴욕 타임스에 언급되거나 투데이 쇼에 출연하기 위해서는 많은 시간과 노력과 신뢰가 필요합니다. 아마도 ...

편집자의 선택

Ning 사용자 기고에 대한 코멘트 방법 - 인형

Ning 사용자 기고에 대한 코멘트 방법 - 인형

Ning 계정에 로그인하면 다른 Ning 사용자의 블로그 게시물, 회신 한 이벤트, 사진 및 비디오에 대한 의견을 남깁니다. 회원님의 논평 벽에 남긴 댓글, 순수 텍스트, 다른 웹 사이트 링크 및 퍼간 동영상과 같은 요소가 귀하의 댓글에 포함될 수 있습니다 ...

닝 네트워크의 광고 제어 방법 - 덤프

닝 네트워크의 광고 제어 방법 - 덤프

기본적으로 닝 네트워크는 애드 센스 광고는 오른쪽 열에 있습니다. 누군가 광고를 클릭하면 생성 된 모든 수익이 Ning으로 이동합니다. 네트워크에서 광고를 게재하여 수익을 얻고 싶거나 광고를 전혀 원하지 않는 경우 제어 광고 프리미엄 서비스를 구입해야합니다.

Ning에서 그룹을 만드는 방법 - Dingy

Ning에서 그룹을 만드는 방법 - Dingy

Ning에서 새로운 그룹을 시작하는 것은 가장 멋진 방법 중 하나입니다. 네가 닝 네트워크에서 할 수있는 일. 그룹을 만들 수 있도록 네트워크가 설정되어 있다면 다음 단계를 따르십시오.

편집자의 선택

Canon Rebel T3 시리즈 카메라로 원시 이미지 파일 처리하기 - 더미 파일

Canon Rebel T3 시리즈 카메라로 원시 이미지 파일 처리하기 - 더미 파일

Canon Rebel T3 또는 T3i로 촬영 한 이미지를 원시 데이터로 캡처 할 수 있습니다. Canon 소프트웨어를 사용하는 경우 Raw 파일을 즉시 인쇄 할 수는 있지만 인쇄하기 전에 사진 작업실로 가져 가서 온라인으로 공유하거나 사진 소프트웨어에서 편집 할 수 있습니다.

Canon Rebel T3 시리즈 카메라에서 자동 초점 포인트 설정 - 인형

Canon Rebel T3 시리즈 카메라에서 자동 초점 포인트 설정 - 인형

Canon Rebel T3 또는 T3i를 사용하는 스포츠 모드에서는 카메라가 중심 초점 위치에 초점을 둡니다. Creative 자동 및 A-DEP 모드뿐만 아니라 다른 완전 자동 노출 모드 (장면 인텔리전스 자동, 인물, 풍경 등)에서 카메라의 자동 초점 시스템은 9 개의 자동 초점을 모두 찾습니다 ...