개인 재정 MapReduce 작업을 최적화하는 방법 - 큰 데이터 프로젝트를 위해 MapReduce를 사용하여 실제 응용 프로그램 코드를 최적화하는 것 외에도 더미

MapReduce 작업을 최적화하는 방법 - 큰 데이터 프로젝트를 위해 MapReduce를 사용하여 실제 응용 프로그램 코드를 최적화하는 것 외에도 더미

차례:

비디오: 대용량 데이터 분석을 위한 병렬 Clustering 알고리즘 최적화 2024

비디오: 대용량 데이터 분석을 위한 병렬 Clustering 알고리즘 최적화 2024
Anonim

큰 데이터 프로젝트를 위해 MapReduce를 사용하여 실제 애플리케이션 코드를 최적화하는 것 외에도, 최적화 기술을 사용하여 신뢰성과 성능을 향상시킵니다. 하드웨어 / 네트워크 토폴로지, 동기화 및 파일 시스템의 세 가지 범주로 분류됩니다.

빅 데이터 하드웨어 / 네트워크 토폴로지

응용 프로그램과는 별도로 가장 빠른 하드웨어 및 네트워크는 소프트웨어 실행 시간이 가장 빠를 것입니다. MapReduce의 뚜렷한 장점은 상용 하드웨어 및 표준 네트워크의 저렴한 클러스터에서 실행할 수 있다는 것입니다. 서버가 물리적으로 구성되어있는 곳에주의를 기울이지 않으면 큰 데이터 작업을 지원하는 데 필요한 최상의 성능과 높은 수준의 내결함성을 얻지 못할 것입니다.

상용 하드웨어는 종종 데이터 센터의 랙에 저장됩니다. 랙 내에서의 하드웨어 근접성은 데이터 및 / 또는 코드를 랙에서 랙으로 이동하는 것과는 대조적으로 성능 이점을 제공합니다. 구현 중에 MapReduce 엔진이 이러한 근접성을 인식하고 활용할 수 있도록 구성 할 수 있습니다.

데이터와 코드를 함께 유지하는 것이 MapReduce 성능을 최적화하는 최선의 방법 중 하나입니다. 본질적으로 하드웨어 처리 요소가 서로 가까울수록 처리해야 할 대기 시간은 줄어 듭니다.

노드 내에서 모든 매핑 결과를 유지하는 것은 비효율적이기 때문에 동기화 메커니즘은 매핑 결과를 완료 한 직후 축소 노드에 복사하므로 즉시 처리를 시작할 수 있습니다. 동일한 키의 모든 값이 동일한 감속기로 전송되므로 성능과 효율성이 향상됩니다.

축소 출력은 파일 시스템에 직접 작성되므로 최상의 결과가 나오도록 설계하고 조정해야합니다.

큰 데이터 파일 시스템

MapReduce 구현은 분산 파일 시스템에서 지원됩니다. 로컬 파일 시스템과 분산 파일 시스템 간의 주요 차이점은 용량입니다. 큰 데이터 환경에서 엄청난 양의 정보를 처리하려면 파일 시스템을 네트워크의 여러 시스템이나 노드에 분산시켜야합니다.

MapReduce 구현은 마스터 노드가 모든 메타 데이터, 액세스 권한, 파일 및 블록의 매핑 및 위치 등을 저장하는 마스터 - 종속 스타일의 배포에 의존합니다. 슬레이브는 실제 데이터가 저장되는 노드입니다. 모든 요청은 마스터에 전달 된 다음 적절한 슬레이브 노드에 의해 처리됩니다.파일 시스템의 설계를 고려할 때 다음 사항을 고려해야합니다.

따뜻하게 유지:

  • 예상대로 마스터 노드는 모든 것이 시작되기 때문에 과로해질 수 있습니다. 또한 마스터 노드에 장애가 발생하면 마스터가 복원 될 때까지 전체 파일 시스템에 액세스 할 수 없습니다. 매우 중요한 최적화는 온라인 마스터에 문제가 발생하면 서비스로 이동할 수있는 "웜 대기 (warm standby)"마스터 노드를 만드는 것입니다. 파일 크기도 커집니다.

  • 파일 크기도 중요한 고려 사항입니다. 많은 작은 파일 (100MB 미만)은 피해야합니다. MapReduce 엔진을 지원하는 분산 파일 시스템은 적당한 수의 큰 파일로 채워질 때 가장 잘 작동합니다. 긴 관점:

  • 작업 부하가 일괄 적으로 관리되기 때문에 매퍼 또는 리듀서의 빠른 실행 시간보다 매우 높은 네트워크 대역폭이 중요합니다. 최적의 접근법은 코드가 읽는 동안 많은 양의 데이터를 스트리밍하고 파일 시스템에 쓸 시간이되면 다시 스트리밍하는 것입니다. 안전을 지키십시오.

  • 하지만 지나치게 그렇게하지 마십시오. 분산 파일 시스템에 보안 계층을 추가하면 성능이 저하됩니다. 악의적 인 동작이 아닌 의도하지 않은 결과를 방지하기 위해 파일 사용 권한이 있습니다. 가장 좋은 방법은 승인 된 사용자 만 데이터 센터 환경에 액세스하고 분산 파일 시스템을 외부로부터 보호하는 것입니다.

MapReduce 작업을 최적화하는 방법 - 큰 데이터 프로젝트를 위해 MapReduce를 사용하여 실제 응용 프로그램 코드를 최적화하는 것 외에도 더미

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...