개인 재정 Hadoop에서의 돼지 라틴 응용 프로그램 흐름

Hadoop에서의 돼지 라틴 응용 프로그램 흐름

비디오: Hadoop Processing Frameworks 2025

비디오: Hadoop Processing Frameworks 2025
Anonim

Pig Latin은 데이터 흐름 및 데이터가 흐르는대로 적용되는 일련의 변환을 정의하는 dataflow 언어입니다 귀하의 신청서를 통해 이것은 일련의 명령어를 작성하는 제어 흐름 언어 (C 또는 Java와 유사)와는 대조적입니다.

제어 흐름 언어에서 루프 및 조건 논리 (if 문과 같은)와 같은 구문을 사용합니다. 돼지 라틴어에서 루프 및 if 문을 찾을 수 없습니다.

Pig를 사용하여 작업하는 것이 Map 및 Reduce 프로그램을 작성하는 것보다 훨씬 쉽다는 확신이 필요하면 실제 돼지 구문을 살펴보십시오.

A = LOAD '데이터 _ 파일. txt ';. B = 그룹 …; … C = 필터 …;. 덤프 B;. '결과'에 저장;

이 예제의 일부 텍스트는 실제로 영어처럼 보입니다. 맞습니까? 이 시점에서 적어도 무서운 것은 아닙니다. 각 라인을 차례로 보면 돼지 프로그램의 기본 흐름을 볼 수 있습니다. (이 코드는 스크립트의 일부일 수도 있고 Grunt라고 불리는 대화 형 셸에서 발행 될 수도 있습니다.)

  1. 로드: 먼저 조작하려는 데이터를로드 (LOAD)합니다.

    일반적인 MapReduce 작업과 마찬가지로 해당 데이터는 HDFS에 저장됩니다. Pig 프로그램이 데이터에 액세스하려면 먼저 Pig에게 사용할 파일을 지정하십시오. 이 태스크에서는 LOAD 'data_file'명령을 사용합니다.

    여기서 'data_file'은 HDFS 파일이나 디렉토리를 지정할 수 있습니다. 디렉토리가 지정되면 해당 디렉토리의 모든 파일이 프로그램에로드됩니다.

    데이터가 Pig에 기본적으로 액세스 할 수없는 파일 형식으로 저장되는 경우 선택적으로 USING 함수를 LOAD 문에 추가하여 읽을 수있는 사용자 정의 함수를 지정할 수 있습니다 (해석).

  2. 변형: 변형 된 집합을 통해 데이터를 실행하면 자신이 염려해야 할 대상에서 멀리 떨어진 곳에서지도 및 축소 작업 집합으로 변환됩니다.

    변환 논리는 모든 데이터 조작이 이루어지는 곳입니다. 여기에서는 관심이없는 행을 필터링하여 두 세트의 데이터 파일을 조인하고 집계를 구성하는 GROUP 데이터, ORDER 결과 등을 수행 할 수 있습니다.

  3. 덤프: 마지막으로 결과를 파일

    또는

    저장 (STORE) 파일에 어딘가에 덤프 (덤프)합니다.

    일반적으로 프로그램을 디버깅 할 때 화면에 출력을 보내려면 DUMP 명령을 사용합니다. 프로그램을 프로덕션으로 가져 가면 DUMP 호출을 STORE 호출로 변경하여 프로그램 실행 결과를 추가 처리 또는 분석을 위해 파일에 저장합니다.

Hadoop에서의 돼지 라틴 응용 프로그램 흐름

편집자의 선택

PowerPoint 2016의 다른 슬라이드에 하이퍼 링크를 만드는 방법 - PowerPoint 2016의

PowerPoint 2016의 다른 슬라이드에 하이퍼 링크를 만드는 방법 - PowerPoint 2016의

하이퍼 링크는 슬라이드 나 다른 프레젠테이션, Word 문서 나 Excel 스프레드 시트와 같은 다른 유형의 문서를 소환하기 위해 슬라이드를 볼 때 클릭 할 수있는 간단한 텍스트 또는 그래픽 이미지입니다. 하이퍼 링크를 클릭하면 페이지로 연결될 수도 있습니다.

PowerPoint 2007 슬라이드에서 작업 단추를 만드는 방법 - 동작 버튼 배치

PowerPoint 2007 슬라이드에서 작업 단추를 만드는 방법 - 동작 버튼 배치

PowerPoint 슬라이드에서 PowerPoint 슬라이드를 순서에 관계없이 볼 수 있으며 사운드 및 비디오 클립에 액세스 할 수 있습니다. PowerPoint 슬라이드에 단추를 추가하려면 단추를 배치 할 슬라이드로 이동하여 다음 단계를 따르십시오.

편집자의 선택

SAT 연습 문제 : SAT 수학 시험에서 여러 개의 그래프 - 더미

SAT 연습 문제 : SAT 수학 시험에서 여러 개의 그래프 - 더미

를 읽으면 질문이 생길 수 있습니다 하나의 그래프가 아니라 두 개를 포함합니다. 이러한 종류의 질문은 두 가지 그래프 사이의 관계를 탐구하도록 요구합니다. 다른 카운티의 차가운 시리얼 판매를 비교하는 다음 연습 질문에서와 같습니다. 연습 문제 두 가지 질문은 다음을 기반으로합니다 ...

SAT 연습 문제 : Sec, Csc 및 Cot Questions - 더미

SAT 연습 문제 : Sec, Csc 및 Cot Questions - 더미

SOH CAH TOA로 대표되는 삼각 비율의 경우 SAT Math 시험은 세컨드, 코사인 또는 코탄 센트로 작업해야하는 질문이있을 수 있습니다. 다행히도 사인, 코사인 또는 접선의 역수를 찾는 문제 일뿐입니다. 다음 연습 문제는 상호 작전을 수행하도록 요청합니다.

SAT 연습 문제 : 급진주의자를 포함하는 SAT 수학 시험에서 질문을 만났을 때 급식 문제 -

SAT 연습 문제 : 급진주의자를 포함하는 SAT 수학 시험에서 질문을 만났을 때 급식 문제 -

해결 , "9의 제곱근은 무엇입니까? "급진주의자는 그 질문의 한 부분 일 뿐이다. 다음 연습 문제는 위협적으로 보일지 모르지만 급진주의를 해결하는 방법을 알고 있다면 그 문제를 해결할 수 있습니다. 연습 ...

편집자의 선택

흑백 HDR : Photoshop Duotone 도구로 색상 화 - 더미

흑백 HDR : Photoshop Duotone 도구로 색상 화 - 더미

컬러링 (종종 색조 또는 색조라고도 함) 흑백 HDR 이미지는 흑백 이미지보다 하나, 둘 또는 그 이상의 색상을 오버레이하여 결과적으로 노화 또는 기타 창의적인 효과를냅니다. Photoshop에는 Elements (Colorizing, Color Variations 및 Color Layers)와 동일한 기능이 많이 있지만 강력한 제어 기능을 제공하는보다 강력한 사용자 기능이 제공됩니다.

HDR 파노라마의 프레임 혼합 - 더미

HDR 파노라마의 프레임 혼합 - 더미

혼합을 사용하면 Photoshop Elements가 어떻게 서로 다른 레이어를 HDR 파노라마를 만든 다음 합성하여 합성 이미지를 만듭니다. 이 프로세스는 파노라마의 한 프레임에서 어떤 것이 더 좋게 보이지만 그 지점이 다른 요소의 동일한 지점을 선호하도록 요소에 의해 마스크 된 경우에 유용합니다.

매크로 또는 클로즈업 사진 비율 - 대부분의 경우 더미

매크로 또는 클로즈업 사진 비율 - 대부분의 경우 더미

매크로와 클로즈업 사진 사이에는 상관이 없습니다. 피사체에 매우 가까이 다가 갈 수있는 능력이 있으면 작은 세부 사항을 밝히고 더 작은 피사체를 촬영할 수 있지만 피사체에 얼마나 가까이 다가 가느냐는 크기와 메시지에 비례합니다. 더 가까워서 항상 좋은 것은 아닙니다.