차례:
- Amazon의 대용량 데이터 용 공개 Elastic Compute Cloud
- 가상 컴퓨터 컴퓨팅을위한 클라우드 기반 기능인 Google Compute Engine은 에너지 효율적인 데이터 센터를 통해 안전하고 유연한 컴퓨팅 환경을 제공합니다. Google은 또한 Google Compute Engine 용 제품을 최적화 한 여러 기술 파트너의 작업 부하 관리 솔루션을 제공합니다.
- OpenStack의 목표는 모든 하드웨어에서 실행할 수있는 대규모로 확장 된 멀티 테넌트 클라우드 사양을 제공하는 것입니다. OpenStack은 Dell, HP, Intel, Cisco, Red Hat 및 IBM을 비롯하여 클라우드 플랫폼을 채택하는 데 관심이있는 파트너로 구성된 대규모 에코 시스템을 구축하고 있으며 클라우드 오퍼링의 기초로 OpenStack을 사용하는 최소 100 명의 다른 파트너도 참여하고 있습니다.
비디오: 포럼IT 딥토크 이벤트 - AI 시대의 클라우드, 그 미래의 과제 "클라우드와 AI로 일으키고 있는 디지털 트랜스포메이션, 지금 우리는 어느 정도 하고 있나?" 2024
클라우드 공급자는 모든 형태와 크기로 제공되며 큰 데이터를 위해 다양한 제품을 제공합니다. 일부는 가계 이름이고 다른 일부는 최근에 출현하고 있습니다. 큰 데이터에 사용할 수있는 IaaS 서비스를 제공하는 일부 클라우드 제공 업체에는 Amazon이 포함됩니다. AT & T, GoGrid, Joyent, Rackspace, IBM, Verizon / Terremark 등이 있습니다.
Amazon의 대용량 데이터 용 공개 Elastic Compute Cloud
현재 가장 주목받는 IaaS 서비스 제공 업체 중 하나는 Elastic Compute Cloud (Amazon EC2)를 사용하는 Amazon Web Services입니다. Amazon은 대규모 인프라 서비스 비즈니스를 구축하려는 비전으로 시작하지 않았습니다.
Amazon EC2는 사용자가 시간당 리소스를 지불하면서 사용자가 제어 할 수있는 확장 성을 제공합니다. 아마존 EC2의 명명에탄성 이라는 용어를 사용하는 것이 중요합니다. 여기에서 탄력성이란 EC2 사용자가 자신의 요구를 충족시키기 위해 할당 된 인프라 리소스를 늘리거나 줄여야하는 기능을 말합니다. Amazon Elastic MapReduce:
대용량 데이터 처리를 목표로합니다. Elastic MapReduce는 EC2 및 Amazon S3 (Amazon Simple Storage Service)에서 실행되는 호스팅 Hadoop 프레임 워크를 사용합니다. 이제 HBase를 실행할 수 있습니다.
-
Amazon DynamoDB: 완전히 관리되는 SQL (NoSQL) 데이터베이스 서비스. DynamoDB는 자체 프로비저닝, 투명한 확장 성 및 간단한 관리 기능을 제공하는 내결함성이 높고 가용성이 높은 데이터 스토리지 서비스입니다. 안정성과 성능을 높이기 위해 SSD (솔리드 스테이트 디스크)에 구현됩니다.
-
모든 규모의 데이터를 저장하도록 설계된 웹 스케일 서비스. 디자인 센터의 강점은 성능 및 확장 성이므로 다른 데이터 저장소만큼 많은 기능을 갖추고 있지 않습니다. 데이터는 "버킷"에 저장되며 대기 시간이나 규정 요구를 해결하기 위해 물리적 스토리지에 대한 하나 이상의 글로벌 영역을 선택할 수 있습니다.
Amazon 고성능 컴퓨팅: -
전문 작업에 맞춰 튜닝 된이 서비스는 지연이 적은 튜닝 된 고성능 컴퓨팅 클러스터를 제공합니다. 과학자와 학자가 가장 자주 사용하는 HPC는 아마존 및 다른 HPC 제공 업체가 제공하기 때문에 주류로 접어 들고 있습니다.Amazon HPC 클러스터는 특정 작업 부하에 맞게 제작되었으며 새로운 작업을 위해 쉽게 재구성 할 수 있습니다. Amazon RedShift:
-
미리보기에서 사용할 수있는 RedShift는 확장 가능한 MPP 아키텍처를 기반으로하는 페타 바이트 급 데이터웨어 하우징 서비스입니다. Amazon에서 관리하므로 사내 데이터웨어 하우스에 대한 안전하고 신뢰할 수있는 대안을 제공하며 널리 사용되는 여러 비즈니스 인텔리전스 도구와 호환됩니다. 구글의 대용량 데이터 서비스
-
인터넷 검색 업체 인 구글은 또한 대용량 데이터를 목표로하는 다수의 클라우드 서비스를 제공한다. Google Compute Engine:
가상 컴퓨터 컴퓨팅을위한 클라우드 기반 기능인 Google Compute Engine은 에너지 효율적인 데이터 센터를 통해 안전하고 유연한 컴퓨팅 환경을 제공합니다. Google은 또한 Google Compute Engine 용 제품을 최적화 한 여러 기술 파트너의 작업 부하 관리 솔루션을 제공합니다.
Google Big Query:
-
잠재적으로 수십억 개의 행이 포함 된 대용량 데이터 세트에 대해 고속 SQL 쿼리를 실행할 수 있습니다. 데이터를 쿼리하는 것이 좋지만 데이터가 데이터를 수정 한 후에는 수정할 수 없습니다. Google Big Query는 큰 데이터를 처리 할 수있는 OLAP (Online Analytical Processing) 시스템입니다. 특별보고 또는 탐색 분석에 유용합니다. Google Prediction API:
-
방대한 양의 데이터를 처리하는 클라우드 기반의 기계 학습 도구 인 Prediction은 데이터의 패턴을 식별하고 기억할 수 있습니다. 패턴을 사용할 때마다 더 많은 것을 배울 수 있습니다. 패턴은 사기 탐지, 변동 분석 및 고객 감정을 포함하여 다양한 목적으로 분석 될 수 있습니다. Microsoft는 Windows 및 SQL 추상화를 기반으로 PaaS 오퍼링에 일련의 개발 도구, 가상 시스템 지원, 관리 및 미디어 서비스 및 모바일 장치 서비스를 제품화했습니다..Net, SQLServer 및 Windows에 대한 깊은 전문 지식을 가진 고객을 위해 Azure 기반 PaaS의 채택은 간단합니다. 대용량 데이터를 Windows Azure 솔루션에 통합하기위한 새로운 요구 사항을 해결하기 위해 Microsoft는 Windows Azure HDInsight도 추가했습니다. Microsoft에 따르면 Apache Hadoop과 100 % 호환되는 Hortonworks Data Platform (HDP)을 기반으로 구축 된 HDInsight는 Microsoft Excel 및 기타 BI (Business Intelligence) 도구와의 연결을 지원합니다. Azure 외에도 HDInsight는 Windows Server에도 배포 할 수 있습니다.
-
큰 데이터를위한 OpenStack Rackspace와 NASA가 시작한 OpenStack은 공공 또는 사설 클라우드를 겨냥한 오픈 클라우드 플랫폼을 구현하고 있습니다. Rackspace는 조직을 철저히 관리하지만 별도의 OpenStack 기반으로 이전했습니다. 기업은 OpenStack을 독점적 인 구현으로 만들 수 있지만 OpenStack 지정은 표준 구현 서비스에 대한 준수를 요구합니다.
OpenStack의 목표는 모든 하드웨어에서 실행할 수있는 대규모로 확장 된 멀티 테넌트 클라우드 사양을 제공하는 것입니다. OpenStack은 Dell, HP, Intel, Cisco, Red Hat 및 IBM을 비롯하여 클라우드 플랫폼을 채택하는 데 관심이있는 파트너로 구성된 대규모 에코 시스템을 구축하고 있으며 클라우드 오퍼링의 기초로 OpenStack을 사용하는 최소 100 명의 다른 파트너도 참여하고 있습니다.
본질적으로 OpenStack은 데비안 리눅스 배포판을 기반으로하는 운영 체제 인 우분투를 기반으로하는 오픈 소스 IaaS 이니셔티브입니다. Red Hat의 Linux 버전에서도 실행할 수 있습니다.
OpenStack은 컴퓨팅, 객체 스토리지, 카탈로그 및 저장소, 대시 보드, ID 및 네트워킹을 포함한 다양한 서비스를 제공합니다. 큰 데이터 측면에서, Rackspace와 Hortonworks (Apache Hadoop 기반의 오픈 소스 데이터 관리 플랫폼 제공 업체)는 Rackspace가 Hortonworks에 의해 검증되고 지원 될 OpenStack 공개 클라우드 기반 Hadoop 서비스를 출시하고 고객 신속하게 큰 데이터 환경을 만들 수 있습니다.