개인 재정 하둡이란 무엇입니까? - 더미

하둡이란 무엇입니까? - 더미

비디오: Hadoop Tutorial For Beginners | Hadoop Ecosystem Explained in 20 min! - Frank Kane 2025

비디오: Hadoop Tutorial For Beginners | Hadoop Ecosystem Explained in 20 min! - Frank Kane 2025
Anonim

Hadoop은 Apache Software Foundation에서 개발 한 오픈 소스 데이터 처리 도구입니다. Hadoop은 현재 대규모 컴퓨팅을보다 저렴하고 유연하게 만들 수 있도록 설계 되었기 때문에 거대한 양과 다양한 데이터를 처리하기위한 프로그램입니다. 하둡 (Hadoop)의 등장으로 대량 데이터 처리가 훨씬 많은 사람들과 조직에 도입되었습니다.

Hadoop은 구조화, 반 구조화 및 비정형 데이터의 대량 스트림을 처리, 처리 및 그룹화하는 훌륭한 솔루션을 제공합니다. Hadoop을 설정하고 배포함으로써 이전 데이터웨어 하우스에 상주 한 트랜잭션 데이터 세트에만 의존하지 않고 모든 조직 데이터에서 통찰력을 사용하고 그리는 비교적 저렴한 방법을 얻을 수 있습니다.

Hadoop은 대규모 컴퓨팅 요구 사항에 가장 많이 사용되는 프로그램 중 하나입니다. Hadoop은 대부분의 빅 데이터 프로젝트의 데이터 처리 요구 사항을 처리 할 수있는지도 및 축소 레이어를 제공합니다.

Hadoop조차도 데이터가 너무 크고 빠를 때가 있습니다. 이러한 경우 조직은 대안적인 맞춤형 MapReduce 배포로 전환하고 있습니다.

Hadoop은 데이터를 저장하기 위해 범용 하드웨어 클러스터를 사용합니다. 각 클러스터의 하드웨어가 연결되며이 하드웨어는 공유 클러스터 전체에서 병렬로 실행될 때 강력한 컴퓨팅 기능을 제공하는 저가의 저 성능 일반 서버 인 상용 서버 로 구성됩니다. 이 상품 서버는 노드 라고도합니다. Commoditized 컴퓨팅은 대용량 데이터를 처리하고 저장하는 데 드는 비용을 크게 줄입니다.

분산 처리 프레임 워크:

  • Hadoop은 Hadoop MapReduce를 분산 처리 프레임 워크로 사용합니다. 다시 한 번 분산 처리 프레임 워크 는 처리 작업이 노드 클러스터에 분산되어 시스템 전체에 걸쳐 대용량 데이터 볼륨을 매우 신속하게 처리 할 수있는 강력한 프레임 워크입니다. 분산 파일 시스템:

  • Hadoop은 Hadoop 분산 파일 시스템 (HDFS)을 분산 파일 시스템으로 사용합니다. Hadoop에서 실행되는 응용 프로그램의 작업 부하는 Hadoop 클러스터의 노드로 나누어지고 출력은 HDFS에 저장됩니다. Hadoop 클러스터는 수천 개의 노드로 구성 될 수 있습니다. 입출력 (I / O) 프로세스 비용을 낮게 유지하기 위해 Hadoop MapReduce 작업은 가능한 한 데이터에 가깝게 수행됩니다.

이는 감축 작업 프로세서가 처리해야하는 출고 맵 작업 데이터에 최대한 가깝게 위치한다는 것을 의미합니다. 이 설계는 큰 데이터 처리에서 계산 요구 사항을 공유하는 것을 용이하게합니다.

Hadoop은 계층 적 구성도 지원합니다. 노드 중 일부는 마스터 노드로 분류되고 다른 노드는 슬레이브로 분류됩니다.

JobTracker , 로 알려진 마스터 서비스는 여러 슬레이브 서비스를 제어하도록 설계되었습니다. 슬레이브 서비스 ( TaskTrackers 라고도 함)는 각 노드에 하나씩 배포됩니다. JobTracker는 TaskTrackers를 제어하고 Hadoop MapReduce 작업을 할당합니다. Hadoop 2라고하는 새로운 버전의 Hadoop에서는 Hadoop YARN이라는 리소스 관리자가 추가되었습니다. 하둡의 MapReduce와 관련하여 YARN은 자원 관리 및 스케줄링 기능을 수행하는 통합 시스템의 역할을합니다.

Hadoop은 데이터를 일괄 적으로 처리합니다. 따라서 실시간 스트리밍 데이터로 작업하는 경우 큰 데이터 문제를 처리하기 위해 Hadoop을 사용할 수 없습니다. 이는 많은 다른 유형의 큰 데이터 문제를 해결하는 데 매우 유용합니다.

하둡이란 무엇입니까? - 더미

편집자의 선택

여성 건강 : 케겔 운동 방법 - 인형

여성 건강 : 케겔 운동 방법 - 인형

케겔 운동은 성기의 근육을 타겟으로합니다. 이 근육은 출산 중에 발생하는 스트레칭으로 인해 종종 약해지지만, 임신 한 적이없는 여성을 포함하여 어떤 여성이라도 적절한 케겔 (Kegel)을하는 법을 아는 것이 도움이 될 수 있습니다. 본질적으로 케겔 (Kegel)은 생식기에 좋은 운동을 제공하여 ...

폐경기 동안 기대할 사항 - 인형

폐경기 동안 기대할 사항 - 인형

폐경은 모든 여성의 삶의 사실입니다. 다른 연령대의 여러 단계의 증상으로 진행됩니다. 폐경의 결과로 여성은 알을 낳지 않고 생리를 멈추지 만 여성 호르몬, 에스트로겐 및 호르몬의 생성을 감소시킵니다.

여성 건강 : 요로 감염을 예방하는 방법 - 인형

여성 건강 : 요로 감염을 예방하는 방법 - 인형

요로 감염 (UTI)은 상당히 여성의 공통점. 통증이있는 ​​배뇨 나 잦은 소변과 같은 요로 감염의 증상을 발견하면 치료를받는 것이 중요합니다. UTI 치료는 일반적으로 항생제의 빠른 과정이지만 전문가의 도움을받는 데는 지체가 있으면 치료 시간이 길어질 수 있습니다. ...

편집자의 선택

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

Salesforce 조직에서 깨끗한 데이터를 유지 관리하는 많은 회사에서 Salesforce 조직의 깨끗한 데이터 유지 보수

많은 사람들을 위해 일하는 것과 비슷합니다. 많은 기업들이 혜택을 인식하고 있음에도 불구하고 습관을 버리는 것에 저항합니다. 사람들은 깨끗한 데이터가 시스템에 들어갈 수 있도록 시간을 할애하고 싶지 않지만 같은 사람들은 빨리 작업 할 수 있습니다 ...

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce에서 캠페인을 만드는 방법 - Professional, Enterprise 또는 Unlimited Edition 사용자를 위해 제공되는 인형

Salesforce의 모듈은 마케팅 프로그램을 관리, 추적 및 측정하는 데 사용하는 일련의 도구입니다. 캠페인 레코드는 캠페인 레코드입니다. 수동 또는 자동으로 리드, 연락처 및 / 또는 기회 레코드에 링크하여 캠페인에 대한 실제 메트릭을 제공 할 수 있습니다.

편집자의 선택

표시 관련 기사 Joomla 웹 사이트 - 인형

표시 관련 기사 Joomla 웹 사이트 - 인형

Joomla의 또 다른 멋진 모듈은 기사 - 관련 기사. 기사 - 관련 기사는 사이트 방문자가 보려고 선택한 기사와 관련된 기사를 표시하는 모듈입니다. 이 모듈은 현재 기사와 관련된 기사를 어떻게 알 수 있습니까? 그것은 메타 데이터에 입력 할 수있는 메타 데이터 키워드를 사용합니다 ...

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla의 저자, ​​편집자 및 발행인 계정 만들기 - 더미

Joomla는 세 가지 프런트 엔드 사용자, 백엔드 사용자 및 그 중간에있는 특수 클래스의 사용자 클래스가 있습니다. 이 클래스에는 3 개의 사용자 그룹이 있습니다. 작성자는 기사를 제출할 수 있습니다. 편집자는 새 기사를 제출하고 기존 기사를 편집 할 수 있습니다. 게시자는 새 기사를 제출하고 기존 기사를 편집하며 기사를 게시 할 수 있습니다. Joomla 사이트 작성자 작성 ...