개인 재정 Apache Bigtop을 사용하여 Hadoop 환경 설정 - VM 및 Linux 사용에 익숙한 경우 인력

Apache Bigtop을 사용하여 Hadoop 환경 설정 - VM 및 Linux 사용에 익숙한 경우 인력

차례:

비디오: Meetup: Apache Bigtop & Apache Apex (native Hadoop) 2024

비디오: Meetup: Apache Bigtop & Apache Apex (native Hadoop) 2024
Anonim

VM 및 Linux 사용에 익숙하다면 권장되는 것과 다른 VM에 Bigtop을 설치하십시오. 정말로 대담하고 하드웨어를 가지고 있다면, 완전 분산 모드의 시스템 클러스터에 Bigtop을 설치하십시오!

1 단계: VM 다운로드

Hadoop은 널리 사용되는 모든 Linux 배포판에서 실행되므로 Linux VM이 필요합니다. 자유롭게 사용할 수있는 (그리고 합법적 인) CentOS 6 이미지가 있습니다.

이 VM을 실행하려면 랩탑에 64 비트 운영 체제가 있어야합니다. Hadoop은 64 비트 환경이 필요합니다.

VM을 다운로드 한 후 다운로드 한 Zip 파일에서 대상 디렉토리로 VM을 추출합니다. Hadoop으로 약 50GB의 여유 공간이 있어야하며 샘플 데이터에이 공간이 필요합니다.

VM 플레이어가없는 경우 무료로 다운로드 할 수 있습니다.

VM 플레이어를 설정 한 후 플레이어를 열고 파일 → 열기로 이동 한 다음 Linux VM 압축을 푼 디렉토리로 이동하십시오. 호출 된 파일을 찾아서 선택하십시오. 얼마나 많은 프로세서와 얼마나 많은 메모리를 사용할 지에 대한 정보를 볼 수 있습니다. 컴퓨터의 메모리 용량을 확인하고, VM의 절반을 할당하여 사용하십시오. Hadoop은 많은 메모리가 필요합니다.

준비가 되었으면 Play 버튼을 클릭하면 Linux 인스턴스가 시작됩니다. 리눅스가 부팅 될 때 많은 메시지가 날아가고 로그인 화면이 나타납니다. 사용자 이름은 이미 "Tom"으로 설정되어 있습니다. "tomtom"으로 암호를 지정하고 로그인하십시오.

2 단계: Bigtop 다운로드

Linux VM 내에서 화면을 마우스 오른쪽 버튼으로 클릭하고 나타나는 상황 별 메뉴에서 터미널에서 열기를 선택하십시오. 그러면 명령을 실행할 수있는 Linux 터미널이 열립니다. 커서가 깜박이는 것을 볼 수 있도록 터미널 내부를 클릭하고 다음 명령을 입력하십시오. su -

비밀번호를 묻는 메시지가 표시되므로 이전처럼 "tomtom"을 입력하십시오. 이 명령은 사용자를 Linux 컴퓨터의 마스터 계정 인 root로 전환합니다. Hadoop을 설치하려면이 계정이 필요합니다.

루트 액세스 권한으로 (전원이 들리지 않도록) 다음 명령을 실행하십시오:

wget -O / etc / yum. repos. d / bigtop. repo 

http: // www. 아파치. org / dist / bigtop / bigtop-

0. 7. 0 / repos / centos6 / bigtop. repo

이 명령은 본질적으로 웹 요청으로, URL에서 특정 파일을 요청하고이를 특정 경로 (예: /)에 기록합니다.

3 단계: Bigtop 설치하기

리눅스 뒤에있는 천재들은 Hadoop과 같은 거대한 소프트웨어 패키지를 설치해야하는 사람들에게 매우 쉬운 삶을 살 렸습니다.마지막 단계에서 다운로드 한 내용은 전체 Bigtop 패키지 및 모든 종속 항목이 아닙니다. 저장소 파일 (확장자 포함)은 Bigtop 설치에 필요한 소프트웨어 패키지를 설치 프로그램에 알려줍니다.

대형 소프트웨어 제품과 마찬가지로 Hadoop에는 많은 전제 조건이 있지만 걱정할 필요가 없습니다. 잘 설계된 파일은 모든 종속성을 가리키며 설치 프로그램은 컴퓨터에 누락되어 있는지 확인하고 다운로드하여 설치하기에 충분히 똑똑합니다.

여기서 사용하고있는 설치 프로그램은 yum이라고하며, 지금 당장 실행 해 봅니다:

yum install hadoop * mahout * oozie * hbase * hive * hue * pig * zookeeper *

설치할 Hadoop 구성 요소를 선택하고 선택합니다. Bigtop에는 다른 여러 구성 요소가 있지만 여기에서 사용할 수있는 구성 요소는 Bigtop뿐입니다. VM은 새로운 Linux 설치이므로 많은 종속성이 필요하므로 조금만 기다려야합니다.

냠 설치 프로그램은 아주 장황합니다. 따라서 시간이 지날 때 다운로드 및 설치되는 것을 정확히 볼 수 있습니다. 설치 프로세스가 완료되면 "완료!"라는 메시지가 나타납니다. "

4 단계: Hadoop 시작

Hadoop에서 응용 프로그램을 실행하기 전에 수행해야 할 몇 가지 기본 구성 및 설정 작업이 있습니다. 다음은 순서대로입니다.

  1. Java 다운로드 및 설치:

    yum install java-1. 7. 0-openjdk-devel. x86_64
    
  2. NameNode 형식:

    sudo / etc / init. d / hadoop-hdfs-namenode init
    
  3. 가상 배포 된 클러스터에 대한 Hadoop 서비스를 시작합니다. hadoop-hdfs-namenode hadoop-hdfs-datanode에서 i에 대해

    ; sudo 서비스 $ i 시작; done
    
  4. HDFS에 하위 디렉토리 구조를 만듭니다.

    sudo / usr / lib / hadoop / libexec / init-hdfs. sh
    
  5. YARN 데몬을 시작하십시오.

sudo service hadoop-yarn-resourcemanager startsudo service hadoop-yarn-nodemanager start

그리고 그걸로 끝났습니다. 치하! 작동중인 Hadoop 배포를 설치했습니다!

5 단계: 샘플 데이터 세트 다운로드

샘플 데이터 세트를 다운로드하려면 VM 브라우저에서 Firefox 브라우저를 열고 dataexpo 페이지로 이동하십시오.

전체 데이터 세트가 필요하지 않으므로 1987 년부터 시작하십시오. 다운로드 할 시점에서 Archive Manager로 열기 옵션을 선택하십시오.

파일을 다운로드 한 후, 파일을 쉽게 찾을 수있는 홈 디렉토리에 압축을 푸십시오. 추출 단추를 클릭 한 다음 데스크탑 디렉토리를 선택하십시오.

6 단계: 샘플 데이터 세트를 HDFS로 복사

Hadoop 프로그램은 HDFS에 저장된 데이터로만 작업 할 수 있습니다. 이제 1987 년 비행 데이터 파일을 HDFS로 복사하십시오. 다음 명령을 입력하십시오.

hdfs dfs -copyFromLocal 1987. csv / user / root
Apache Bigtop을 사용하여 Hadoop 환경 설정 - VM 및 Linux 사용에 익숙한 경우 인력

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...