개인 재정 Hadoop에서의 돼지 라틴 응용 프로그램 흐름

Hadoop에서의 돼지 라틴 응용 프로그램 흐름

비디오: Hadoop Processing Frameworks 2024

비디오: Hadoop Processing Frameworks 2024
Anonim

Pig Latin은 데이터 흐름 및 데이터가 흐르는대로 적용되는 일련의 변환을 정의하는 dataflow 언어입니다 귀하의 신청서를 통해 이것은 일련의 명령어를 작성하는 제어 흐름 언어 (C 또는 Java와 유사)와는 대조적입니다.

제어 흐름 언어에서 루프 및 조건 논리 (if 문과 같은)와 같은 구문을 사용합니다. 돼지 라틴어에서 루프 및 if 문을 찾을 수 없습니다.

Pig를 사용하여 작업하는 것이 Map 및 Reduce 프로그램을 작성하는 것보다 훨씬 쉽다는 확신이 필요하면 실제 돼지 구문을 살펴보십시오.

A = LOAD '데이터 _ 파일. txt ';. B = 그룹 …; … C = 필터 …;. 덤프 B;. '결과'에 저장;

이 예제의 일부 텍스트는 실제로 영어처럼 보입니다. 맞습니까? 이 시점에서 적어도 무서운 것은 아닙니다. 각 라인을 차례로 보면 돼지 프로그램의 기본 흐름을 볼 수 있습니다. (이 코드는 스크립트의 일부일 수도 있고 Grunt라고 불리는 대화 형 셸에서 발행 될 수도 있습니다.)

  1. 로드: 먼저 조작하려는 데이터를로드 (LOAD)합니다.

    일반적인 MapReduce 작업과 마찬가지로 해당 데이터는 HDFS에 저장됩니다. Pig 프로그램이 데이터에 액세스하려면 먼저 Pig에게 사용할 파일을 지정하십시오. 이 태스크에서는 LOAD 'data_file'명령을 사용합니다.

    여기서 'data_file'은 HDFS 파일이나 디렉토리를 지정할 수 있습니다. 디렉토리가 지정되면 해당 디렉토리의 모든 파일이 프로그램에로드됩니다.

    데이터가 Pig에 기본적으로 액세스 할 수없는 파일 형식으로 저장되는 경우 선택적으로 USING 함수를 LOAD 문에 추가하여 읽을 수있는 사용자 정의 함수를 지정할 수 있습니다 (해석).

  2. 변형: 변형 된 집합을 통해 데이터를 실행하면 자신이 염려해야 할 대상에서 멀리 떨어진 곳에서지도 및 축소 작업 집합으로 변환됩니다.

    변환 논리는 모든 데이터 조작이 이루어지는 곳입니다. 여기에서는 관심이없는 행을 필터링하여 두 세트의 데이터 파일을 조인하고 집계를 구성하는 GROUP 데이터, ORDER 결과 등을 수행 할 수 있습니다.

  3. 덤프: 마지막으로 결과를 파일

    또는

    저장 (STORE) 파일에 어딘가에 덤프 (덤프)합니다.

    일반적으로 프로그램을 디버깅 할 때 화면에 출력을 보내려면 DUMP 명령을 사용합니다. 프로그램을 프로덕션으로 가져 가면 DUMP 호출을 STORE 호출로 변경하여 프로그램 실행 결과를 추가 처리 또는 분석을 위해 파일에 저장합니다.

Hadoop에서의 돼지 라틴 응용 프로그램 흐름

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...