비디오: [클립] 미국 패션유학 비하인드스토리 :: 패션 디자이너 김진 2024
Hadoop 생태계에는 많은 구성 요소가 있으며, 모두 Apache 프로젝트로 존재합니다. Hadoop은 상당히 성장했고 몇 가지 중요한 변경 사항이 있기 때문에 이러한 오픈 소스 커뮤니티 구성 요소의 다른 버전이 다른 구성 요소와 완벽하게 호환되지 않을 수 있습니다. 이는 Apache에서 직접 프로젝트를 다운로드하고 컴파일하여 Hadoop을 독립적으로 시작하려는 사람들에게 상당한 어려움을 낳습니다.
Red Hat이 Linux 용으로 편리한 패키지를 제공 한 것과 같은 방식으로 Hadoop 및 일부 관련 기술을 자체 Hadoop 배포본에 번들로 제공 한 회사가 많습니다. 이 목록은 더 눈에 띄는 것들을 설명합니다:Cloudera
-
: 아마도 Cloudera는 현장에서 가장 유명한 선수일지도 모르지만 Hadoop의 공동 창립자 인 Doug Cutting을 수석 건축가로 주장 할 수 있습니다. Cloudera는 최초의 상업용 Hadoop 배포판을 출시했으며 Hadoop 생태계에 매우 적극적으로 기여한 사람이기 때문에 Hadoop 공간의 시장 리더로서 많은 사람들에게 보입니다. Cloudera Enterprise는 Cloudera가 "Enterprise Data Hub"라고 부르는 제품의 중심에 자리 잡은 제품으로 Hadoop의 오픈 소스 기반 배포판 인 Cloudera Distribution for Hadoop (CDH)과 관련 프로젝트도 포함됩니다. 자사의 독점 Cloudera 관리자. CDH의 핵심 구성 요소에 대한 기술 지원 가입도 포함됩니다.
EMC
: EMC의 Apache Hadoop 배포판 인 Pivotal HD는 EMC의 대규모 병렬 처리 (MPP) 데이터베이스 기술 (이전의 Greenplum, 현재는 HAWQ)과 Apache Hadoop을 기본적으로 통합합니다.그 결과 Hadoop을위한 진정한 SQL 처리 기능을 갖춘 고성능 Hadoop 배포판이 탄생했습니다. SQL 기반 쿼리 및 기타 비즈니스 인텔리전스 도구를 사용하여 HDFS에 저장된 데이터를 분석 할 수 있습니다.Hortonworks
: Hadoop 시장의 또 다른 주요 업체 인 Hortonworks는 Hadoop 생태계 구성 요소에 대한 커미터와 코드 기여자가 가장 많습니다. (커미터는 아파치 프로젝트의 게이트 키퍼이며 코드 변경을 승인 할 권한이있다.)
-
Hortonworks는 Yahoo! 이는 검색 엔진 사업을 지원하기 위해 대규모 플랫폼이 필요했기 때문에 Hadoop 프로젝트의 원동력이었습니다. 모든 Hadoop 배포 공급 업체 중 Hortonworks는 커뮤니티에 기여한 개발 작업의 양과 모든 개발 노력이 오픈 소스 코드베이스로 (결국) 포개 져 있기 때문에 오픈 소스 이동에 가장 헌신적입니다. Hortonworks 비즈니스 모델은 인기있는 HDP 배포를 활용하고 유료 서비스 및 지원을 제공하는 능력을 기반으로합니다. 그러나 독점 소프트웨어는 판매하지 않습니다. 오히려, 회사는 오픈 소스 커뮤니티에서 기업 기능 요구 사항 (예: 하이브로 더 빠른 쿼리 처리)을 해결하는 솔루션을 개발하기위한 아이디어를 열정적으로 지원합니다. Hortonworks는 Teradata, Microsoft, Informatica, SAS 등 데이터 관리 업계에서 이미 확립 된 기업들과 수 많은 관계를 형성해 왔습니다. 이 회사는 자체적 인 Hadoop 제품을 가지고 있지 않지만 Hortonworks와 협력하여 자체 Hadoop 솔루션을 자체 제품 세트에 제공합니다. Hortonworks Hadoop 오퍼링은 Hadoop 및 관련 툴링 및 프로젝트를 포함하는 Hortonworks Data Platform (HDP)입니다. 또한 Cloudera와는 달리 Hortonworks는 오픈 소스 커뮤니티의 프로덕션 레벨 코드로 HDP 버전만을 출시합니다.
-
IBM : Big Blue는 광범위한 Hadoop 제품을 제공하며 오픈 소스 Hadoop 스택 위에 추가 된 가치에 중점을 둡니다.
Intel:
Apache Hadoop 용 Intel Distribution (Intel Distribution)은 대용량 데이터를 분석하는 엔터프라이즈 애플리케이션을위한 분산 처리 및 데이터 관리 기능을 제공합니다.
주요 기능으로는 Intel Xeon 프로세서, Intel SSD 저장 장치 및 Intel 10GbE 네트워킹에 최적화 된 우수한 성능, HDFS의 암호화 및 암호 해독을 통한 데이터 보안 및 HBase의 셀 수준 세분화를 통한 역할 기반 액세스 제어 향상된 하이브 쿼리 성능. 인기있는 오픈 소스 통계 패키지 인 R 용 커넥터로 통계 분석 지원; 인텔 Graph Builder를 통해 분석 그래픽을 제공합니다.
MapR
-
: Apache Hadoop 및 Apache Software Foundation과 독립적 인 관련 프로젝트를 전체적으로 배포하려면 MapR을 살펴보십시오. Java 의존성이나 Linux 파일 시스템에 의존하지 않는 MapR은 완전한 데이터 보호, 단일 실패 지점 및 중요한 사용 편의성을 제공하는 유일한 Hadoop 배포로 승격되고 있습니다. M3, M5 및 M7의 세 가지 MapR 버전을 사용할 수 있습니다. M3 에디션은 무제한으로 사용할 수 있으며 무료입니다. MapR M5는 중급 수준의 서브 스크립 션 소프트웨어입니다. MapR M7은 Pig, Hive, Sqoop 등을 포함하는 Apache Hadoop 및 HBase의 완벽한 배포판입니다.
-