비디오: 우리 오늘부터 절친이다. 2024
Hadoop은 점차 증가하는 새로운 응용 프로그램 세트로 풍부하고 빠르게 진화하는 생태계입니다. 새로운 기능에 대한 모든 요구 사항을 따라 잡기보다는 Pig는 UDF라고도 알려진 사용자 정의 함수 를 통해 확장 가능하도록 설계되었습니다.
UDF는 Java, Python 및 JavaScript를 포함한 많은 프로그래밍 언어로 작성할 수 있습니다. 개발자는 점차 증가하는 UDF 모음을 게시하고 공유합니다. Piggy Bank와 DataFu를 찾으십시오. 이러한 저장소의 일부인 Pig UDF 중 일부는 LOAD / STORE 함수 (예: XML), 날짜 시간 함수, 텍스트, 수학, 및 통계 기능.
Pig는 Pig를 기존 응용 프로그램과 통합 할 수있는 Java, Python 및 JavaScript와 같은 호스트 언어에도 임베드 될 수 있습니다. 또한 돼지 언어의 한계를 극복하는데도 도움이됩니다. 가장 일반적으로 참조되는 제한 사항 중 하나는 Pig가 제어 흐름 문 (if / else, while 루프, for 루프 및 condition 문)을 지원하지 않는다는 것입니다.
돼지는 기본적으로 데이터 흐름을 지원하지만 제어 흐름을 제공하기 위해 다른 언어에 포함되어야합니다. 그러나 제어 흐름 언어로 돼지를 삽입하는 것은 절충점입니다. 예를 들어, Pig 문이 루프에 포함 된 경우 루프가 반복하여 Pig 문을 실행하면 매번 별도의 MapReduce 작업이 실행됩니다.