개인 재정 HDFS에 NameNode가있는 데이터 블록 추적 - 더미

HDFS에 NameNode가있는 데이터 블록 추적 - 더미

차례:

비디오: Hadoop Rack Awareness 2024

비디오: Hadoop Rack Awareness 2024
Anonim

NameNode는 Hadoop 분산 파일 시스템 (HDFS)의 주소록 역할을합니다. 어떤 블록이 개별 파일을 구성하는지뿐만 아니라 이들 블록과 복제본이 각각 저장되는 위치도 포함됩니다. 사용자가 HDFS에 파일을 저장하면 파일은 데이터 블록으로 분할되고 이러한 데이터 블록의 사본 3 개가 Hadoop 클러스터 전체의 슬레이브 노드에 저장됩니다.

추적해야 할 많은 데이터 블록이 있습니다. 예상대로 바디가 어디에 묻혀 있는지 알면 NameNode가 Hadoop 클러스터에서 매우 중요한 구성 요소가됩니다. NameNode를 사용할 수 없으면 응용 프로그램은 HDFS에 저장된 모든 데이터에 액세스 할 수 없습니다.

다음 그림을 보면 마스터 노드 서버에서 실행중인 NameNode 데몬을 볼 수 있습니다. 데이터 블록 및 해당 파일을 다루는 모든 매핑 정보는 이름이 지정된 파일에 저장됩니다.

HDFS는 저널링 파일 시스템입니다. 즉, 편집 로그가 병합 된 마지막 체크 포인트 이후 이벤트를 추적하는 편집 저널에 모든 데이터 변경 내용이 기록됩니다. HDFS에서 편집 저널은 NameNode에 저장된 파일로 유지됩니다.

NameNode 시작 및 조작

NameNode의 작동 방식을 이해하려면 시작하는 방법을 살펴 보는 것이 도움이됩니다. NameNode의 목적은 처리해야하는 데이터 블록의 수와 저장 위치를 ​​추적하기 위해서 애플리케이션에서 사용할 수있는 모든 블록 위치 및 블록 - 파일 매핑이 필요하다는 것입니다. 램.

NameNode가 취하는 단계입니다. NameNode가 시작된 후에 필요한 모든 정보를로드하려면 다음과 같이하십시오.

  1. NameNode는 파일을 메모리로로드합니다.

  2. NameNode는 파일을로드하고 저널링 된 변경 사항을 다시 재생하여 이미 메모리에있는 블록 메타 데이터를 업데이트합니다.

  3. DataNode 디먼은 NameNode 블록 보고서를 송신합니다.

    각 슬레이브 노드에는 거기에 저장된 모든 데이터 블록을 나열하고 각 블록의 상태를 설명하는 블록 보고서가 있습니다.

시작 프로세스가 완료되면 NameNode는 HDFS에 저장된 모든 데이터의 전체 그림을 가지며 Hadoop 클라이언트로부터 응용 프로그램 요청을받을 준비가됩니다.

클라이언트 요청에 따라 데이터 파일을 추가하고 제거하면 변경 사항이 종속 노드의 디스크 볼륨에 기록되고 파일에 대한 저널 업데이트가 수행되며 NameNode의 메모리에 저장된 블록 위치와 메타 데이터에 변경 사항이 반영됩니다.

클러스터의 수명 기간 동안 DataNode 데몬은 3 초마다 NameNode 하트 비트 (빠른 신호)를 전송하여 활성화되었음을 나타냅니다.(이 기본값은 구성 가능합니다.) 6 시간마다 (다시 구성 가능한 기본값) DataNode는 NameNode에 노드에있는 파일 블록을 요약 한 블록 보고서를 보냅니다. 이 방법으로 NameNode에는 항상 클러스터에서 사용 가능한 자원의 현재보기가 있습니다.

데이터 쓰기

HDFS에서 새 파일을 만들려면 다음 프로세스를 수행해야합니다.

  1. 클라이언트가 NameNode에 새 파일을 만들도록 요청을 보냅니다.

    NameNode는 필요한 블록 수를 결정하며 클라이언트는 클러스터에 새 파일 블록을 생성하기 위해 임대 를 부여받습니다. 이리스의 일부로 클라이언트는 작성 태스크를 완료하는 데 시간 제한이 있습니다. 이 시간 제한은 저장 공간이 실패한 클라이언트 응용 프로그램에 의해 차지되지 않도록합니다.

  2. 그러면 클라이언트는 NameNode에 의해 할당 된 임대를 사용하여 파일 블록의 첫 번째 복사본을 슬레이브 노드에 씁니다. NameNode는 쓰기 요청을 처리하고 파일 블록과 해당 복제본을 작성해야 할 위치와 가용성과 성능의 균형을 결정합니다. 파일 블록의 첫 번째 복사본은 하나의 랙에 쓰여지고 두 번째 및 세 번째 복사본은 첫 번째 복사본과 다른 랙에 있지만 동일한 랙에있는 다른 슬레이브 노드에 쓰여집니다. 이러한 구성은 동일한 장애 지점에 데이터 블록이 없음을 보장하면서 네트워크 트래픽을 최소화합니다.

    각 블록이 HDFS에 기록 될 때 특수 프로세스는 나머지 복제본을 NameNode로 식별 된 다른 슬레이브 노드에 씁니다.

  3. DataNode 데몬이 파일 블록 복제본이 생성되었음을 확인한 후 클라이언트 응용 프로그램은 파일을 닫고 NameNode에 알리고 개방 대기열을 닫습니다.

  4. 데이터 읽기

HDFS에서 파일을 읽으려면 다음 프로세스를 수행해야합니다.

클라이언트가 NameNode에 파일 요청을 보냅니다. NameNode는 어떤 블록이 관련되어 있는지를 결정하고, 블록과 클라이언트의 가장 근접한 접근 경로를 기준으로 가장 효율적인 액세스 경로를 선택합니다.

  1. 그러면 클라이언트는 NameNode에 지정된 주소를 사용하여 블록에 액세스합니다.

    Hadoop 클러스터의 데이터 균형 조정

  2. 시간이 지남에 따라 균일하지 않은 데이터 처리 패턴 (일부 슬레이브 노드에 더 많은 데이터가 기록 될 수 있음) 또는 노드 장애의 조합으로 인해 데이터가 랙 전체에 고르지 않게 분산 될 수 있습니다 및 Hadoop 클러스터의 슬레이브 노드로 구성됩니다.

이러한 불규칙한 분포는 개별 슬레이브 노드에 대한 수요가 불균형 해지기 때문에 성능에 나쁜 영향을 줄 수 있습니다. 데이터가 거의없는 노드는 완전히 사용되지 않습니다. 블록이 많은 노드는 과도하게 사용됩니다. (

참고:

남용 및 과소 사용은 CPU 또는 RAM이 아닌 디스크 활동을 기반으로합니다.) HDFS에는 남용 된 슬레이브 노드의 블록을 사용량이 적은 슬레이브 노드로 재 분산시키는 밸런서 유틸리티가 포함되어 있습니다. 다른 슬레이브 노드와 랙에있는 블록. Hadoop 관리자는 HDFS 상태를 정기적으로 확인해야하며 데이터가 고르지 않게 분산되면 밸런서 유틸리티를 호출해야합니다. NameNode 마스터 서버 디자인

NameNode 데몬을 실행하는 마스터 서버는 미션 크리티컬하기 때문에 슬레이브 노드와는 다른 하드웨어 요구 사항을 필요로합니다. 가장 중요한 점은 중단 가능성을 최소화하기 위해 엔터프라이즈 급 구성 요소를 사용해야한다는 것입니다. 또한 HDFS에 저장된 모든 데이터 블록에 대한 모든 메타 데이터 및 위치 데이터를 메모리에로드하기에 충분한 RAM이 필요합니다.

HDFS에 NameNode가있는 데이터 블록 추적 - 더미

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...