개인 재정 Hadoop을 이용한 로그 분석 - 더미

Hadoop을 이용한 로그 분석 - 더미

비디오: MongoDB 프로그래밍 12강 MapReduce 개념 살펴보기 | T아카데미 2024

비디오: MongoDB 프로그래밍 12강 MapReduce 개념 살펴보기 | T아카데미 2024
Anonim

로그 분석은 초기 Hadoop 프로젝트의 일반적인 사용 사례입니다. 사실, Hadoop의 초기 사용은 클릭 스트림 로그의 대규모 분석을위한 것이 었습니다 - 사람들이 방문하는 웹 페이지 및 방문 순서에 대한 데이터를 기록하는 로그.

IT 인프라에서 생성되는 모든 데이터 로그는 종종 데이터 배출량이라고합니다. 로그는 작동중인 엔진의 배기 파이프에서 오는 연기와 같이 작동하는 서버의 부산물입니다. 데이터 배출은 오염이나 낭비를 의미하며, 많은 기업들이 의심 할 여지없이 이러한 생각을 염두에두고 이러한 종류의 데이터에 접근합니다.

로그 데이터는 종종 빠르게 커지며 대량 생산으로 인해 분석이 지루할 수 있습니다. 그리고이 데이터의 잠재적 인 가치는 종종 불분명합니다. 따라서 IT 부서의 유혹은 합리적으로 가능한 한 짧은 시간 동안이 로그 데이터를 저장하는 것입니다. (결국, 데이터를 보유하는 데 비용이 들며, 비즈니스 가치가 없다면 왜 저장해야합니까?)

하지만 Hadoop은 계산을 변경합니다. 데이터 저장 비용은 비교적 저렴하며 Hadoop은 원래 로그 데이터의 대량 일괄 처리

로그 데이터 분석 유스 케이스는 작업하는 데이터가 삭제되거나 바닥에 떨어질 가능성이 있기 때문에 Hadoop 여행을 시작하는 데 유용한 곳입니다. "1 주일에 1 테라 바이트 (TB) 이상의 고객 웹 활동을 지속적으로 기록하는 일부 회사는 분석하지 않고 데이터를 버립니다. 이로 인해 왜 수집해야하는지 궁금해집니다.

신속한 시작을 위해이 유스 케이스의 데이터는 쉽게 얻을 수 있으며 일반적으로 다른 (관할) 데이터로 Hadoop 여행을 시작하면 발생할 수있는 동일한 문제를 포괄하지 않습니다.

대부분의 가정에는 현재 전기 사용량을 기록하는 스마트 미터기가 있습니다. 최신 자동차에는 수천 가지 센서가있어 자신의 상태와 사용 측면을 기록합니다. 인터넷을 탐색하는 동안 사용자가 클릭하고 마우스를 움직이면 모든 로그 항목이 생성됩니다.

신용 카드 또는 직불 카드를 사용하지 않아도 무언가를 구매할 때마다 시스템은 활동을 데이터베이스 및 로그에 기록합니다.보다 일반적인 로그 데이터 소스 (IT 서버, 웹 클릭 스트림, 센서 및 트랜잭션 시스템)를 볼 수 있습니다.

모든 산업 (방금 설명한 모든 로그 유형뿐 아니라)은 귀중한 분석을위한 거대한 잠재력을 가지고 있습니다. 특히 특정 활동에 집중할 수 있고 결과를 다른 데이터 세트와 연관시켜 상황을 제공 할 수있는 경우 특히 그렇습니다.

예를 들어 다음과 같은 일반적인 웹 기반 탐색 및 구매 경험을 고려하십시오.

사이트를 서핑하고 구매할 제품을 찾습니다.

  1. 눈을 끈 제품에 대한 설명을 보려면 클릭하십시오.

  2. 결국, 장바구니에 항목을 추가하고 결제 (구매 작업)로 진행합니다.

  3. 배송 비용을 확인한 후에는 품목 가격이 저렴하고 브라우저 창을 닫을 수 있습니다. 귀하가 만든 모든 클릭 - 그리고 그만 두는 -은이 전자 상거래 사이트 뒤에있는 회사에 귀중한 통찰력을 제공 할 수 있습니다.

이 예에서는이 비즈니스가 고객에게 더 나은 서비스를 제공하는 방법을 이해하기 위해 클릭 스트림 데이터 (방문자가 "터치하는 모든 마우스 클릭 및 페이지 뷰에 대한 데이터)를 수집한다고 가정합니다. 전자 상거래 비즈니스 중 하나의 공통 과제는 버려진 장바구니의 핵심 요소를 인식하는 것입니다. 클릭 스트림 데이터에 대한 심층적 인 분석을 수행하고 사이트에서의 사용자 동작을 검사하면 패턴이 출현해야합니다.

귀사는 겉보기에 간단한 질문에 대한 답을 알고 있습니까? "특정 제품이 다른 제품보다 더 많이 버려 졌습니까? "아니면 카트 포기 율을 10 % 낮추면 얼마나 많은 수익을 얻을 수 있을까요? "다음은 비즈니스 리더가 Hadoop 원인에 대한 투자를 유도 할 수 있음을 보여주는 보고서의 예입니다.

표시된 그래프를 작성하기 위해 데이터를 생성 할 수있는 시점까지 개별 사용자의 웹 탐색 세션을 분리 (

세션 화) 라고하며, 장바구니의 내용을 식별합니다 클릭 스트림 데이터를 검토하여 세션 종료시 트랜잭션 상태를 설정할 수 있습니다. 다음은 모든 클릭 수와 URL 주소를 IP 주소별로 그룹화하여 사용자의 웹 브라우징 세션을 구성하는 방법의 예입니다.

Hadoop 컨텍스트에서는 항상 키와 값으로 작업합니다. MapReduce의 각 단계는 키와 값 집합으로 데이터를 입력 및 출력합니다. 키는 IP 주소이며 값은 타임 스탬프와 URL로 구성됩니다. 맵 단계에서 사용자 세션은 Hadoop 클러스터에 저장된 클릭 스트림 데이터 세트의 모든 파일 블록에 대해 병렬로 어셈블됩니다.

방문한 최종 페이지

장바구니에있는 항목 목록

  • 각 사용자 세션에 대한 트랜잭션 상태 (IP 주소 키로 인덱싱 됨)

  • 감속기는이 기록을 수집하고 월간 포기 된 카트의 수와 가치를 합산하고 집계를 수행하여 사용자 세션을 종료하기 전에 누군가가 본 가장 일반적인 최종 페이지의 총계를 제공합니다.

Hadoop을 이용한 로그 분석 - 더미

편집자의 선택

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

자동으로 단어 채우기 Word 2003 자동 텍스트 - 더미

로 자동 채우기 Word 2003의 상용구 기능은 자동으로 단어 쓰기를 완료합니다. 철자하기 시작 했어. 당신이 영웅으로 크리스토퍼를 특징으로하는 다음 Great American Novel을 쓰고 있다고합시다. Christopher 철자를 반복해서 쓰는 대신 이름의 몇 글자 만 입력하면 팝업 상자가 나타납니다. 그것은 말한다 : 크리스토퍼 : (삽입하려면 Enter 키를 누릅니다). ...

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항 인 > Word 2013의 파일 메뉴 - 더미

의 기본 사항은 파일 탭을 클릭하면 파일 메뉴가 열립니다. Backstage보기라고합니다. Backstage보기는 작업중인 데이터 파일과 관련된 명령 (예 : 저장, 열기, 인쇄, 우편 발송 및 속성 확인)에 대한 액세스를 제공합니다. Backstage보기를 종료하려면 다른 탭을 클릭하거나 ...

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

Word 2007에서 SmartArt의 빠른 스타일 변경 - 더미

당신은 여러모로 그 모양을 조정할 수 있습니다. 가장 쉬운 방법은 다이어그램에 적용된 빠른 스타일을 변경하는 것입니다. 빠른 스타일은 단순히 색상 및 모양 효과와 같은 서식 요소 모음을 구성하는 요소 중 일부에 할당됩니다.

편집자의 선택

실습 초등 교육 시험 - 실습 - 실습

실습 초등 교육 시험 - 실습 - 실습

Praxis 초등 교육 시험에는 commutative, associative, distributive 및 substitution의 4 가지 주요 속성을 이해해야합니다. 교환 가능 속성 및 결합 속성에는 더하기 및 곱하기 버전이 있습니다. 세 개 이상의 숫자가 추가되면 추가되는 순서는 중요하지 않습니다. 그 합계 ...

초등 교육 시험 문장 구조 - 더미

초등 교육 시험 문장 구조 - 더미

초등학교 교사는 문장의 다른 부분뿐만 아니라 문장의 다른 종류. 예를 들어, Praxis 초등 교육 시험에 나오는 문장 구조에 관한 질문은 주제와 술어 또는 화합물과의 차이점을 알아야 할 수도 있습니다.

초등 교육 시험 작문 구조 - 인형

초등 교육 시험 작문 구조 - 인형

학생들은 공통 구조를 사용하여 작문을 구성한다. 인과 관계, 연대순, 비교 및 ​​계약. Praxis Elementary Education 시험은 귀하가 이러한 구조를 잘 알고 있어야합니다. 다음 목록에는 공통 구조 (사용되는 경우)와 자주 사용되는 단어가 링크되어 있습니다. 원인과 결과 ...

편집자의 선택

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 2014의 블록 정의 편집 대화 상자 사용 방법 - 인형

AutoCAD 도면에는 여섯 가지 종류의 시트가 표시됩니다. 한 가지 방법은 모두를 대표하는 세 가지 표준 블록을 만드는 것입니다. 또는 단일 동적 블록을 만들고 세 가지 유형 모두를 포괄하는 가시성 상태를 정의 할 수 있습니다. 다음 단계에서는 블록을 두 배로 만드는 방법을 보여줍니다 (또는 트리플 ...).

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014에서 MLeaDer 명령 사용 방법 - 인형

AutoCAD 2014를 사용하면 다중 지시선 MLeaDer 명령을 사용하여 동시에 지시선과 여러 줄 문자로 구성된 객체; 다음과 같은 간단한 단계를 따르십시오. 사용자의 필요에 따라 적절한 다중 지시선 스타일을 설정하십시오. 홈 탭의 다중 지시선 스타일 드롭 다운 목록에서 기존 스타일 선택 ...