개인 재정 빅 데이터에 필요한 데이터 식별 - 더미

빅 데이터에 필요한 데이터 식별 - 더미

차례:

비디오: ‘금융 데이터’ 사고 판다…‘데이터 거래소’ 연내 구축 2025

비디오: ‘금융 데이터’ 사고 판다…‘데이터 거래소’ 연내 구축 2025
Anonim

대용량 데이터 프로젝트에서 다루는 데이터 유형을 고려하십시오. 많은 조직에서는 과거에 많은 내부적으로 생성 된 데이터가 최대한의 잠재력을 발휘하지 못했다는 사실을 인식하고 있습니다.

새로운 도구를 활용하여 조직은 전자 메일, 고객 서비스 레코드, 센서 데이터 및 보안 로그에서 이전에 사용되지 않은 비 체계적인 데이터 소스를 통해 새로운 통찰력을 얻고 있습니다. 또한 소셜 미디어, 휴대 전화 위치, 트래픽 및 날씨와 같이 조직 외부에서 주로 발생하는 데이터 분석을 기반으로하는 새로운 통찰력을 찾는 데 많은 관심이 있습니다.

대용량 데이터의 탐색 단계

분석 초기 단계에서 데이터의 패턴을 검색하려고합니다. 매우 많은 양의 데이터를 검토하여 요소간에 예기치 않은 새 관계와 상관 관계가 분명해질 수 있습니다. 이러한 패턴은 예를 들어 새로운 제품에 대한 고객 선호도에 대한 통찰력을 제공 할 수 있습니다. 이러한 패턴을 찾기 위해 큰 데이터를 구성하기위한 플랫폼이 필요합니다.

Hadoop은 큰 데이터를 캡처하고 처리하기위한 기본 빌딩 블록으로 널리 사용됩니다. Hadoop은 대용량 데이터의 처리 속도를 높이고 비교적 짧은 시간에 엄청난 양의 데이터 패턴을 식별 할 수 있도록 설계되었습니다. Hadoop의 두 가지 주요 구성 요소 인 Hadoop 분산 파일 시스템 (HDFS)과 MapReduce는 큰 데이터를 관리하고 처리하는 데 사용됩니다.

대용량 데이터에서 숨겨진 패턴을 검색하기 위해 매우 많은 양의 스트리밍 데이터를 수집, 집계 및 이동해야하는 경우가 있습니다. ETL과 같은 기존의 통합 도구는 실시간 사기 탐지와 같은 분석 결과를 제 시간에 제공하기 위해 대량의 데이터 스트림을 이동할만큼 빠르지 않습니다. FlumeNG는 데이터를 Hadoop으로 스트리밍하여 실시간으로 데이터를로드합니다. 일반적으로 Flume은 분산 서버에서 많은 양의 로그 데이터를 수집하는 데 사용됩니다. Flume 설치에서 모든 실제 및 논리 노드를 추적합니다. 에이전트 노드는 서버에 설치되며 데이터의 단일 스트림이 시작 지점에서 대상 지점으로 전송되고 처리되는 방식을 관리합니다. 또한 콜렉터는 데이터 스트림을 Hadoop 파일 시스템이나 다른 대형 데이터 스토리지 컨테이너에 기록 할 수있는 더 큰 스트림으로 그룹화하는 데 사용됩니다. Flume은 확장 성을 위해 설계되었으며 시스템에 더 많은 자원을 지속적으로 추가하여 대용량 데이터를 효율적으로 처리 할 수 ​​있습니다.Flume의 출력물은 Hadoop 및 Hive와 통합되어 데이터를 분석 할 수 있습니다.

Flume에는 데이터에 사용할 변환 요소가 있으며 Hadoop 인프라를 구조화되지 않은 데이터의 스트리밍 소스로 변환 할 수 있습니다.

대용량 데이터의 패턴

대용량 데이터 분석으로 경쟁 우위를 점하기 시작한 기업의 사례를 많이 볼 수 있습니다. 많은 기업에서 소셜 미디어 데이터 스트림은 점점 더 디지털 마케팅 전략의 필수 구성 요소가되고 있습니다. 탐색 단계에서는이 기술을 사용하여 방대한 양의 스트리밍 데이터를 빠르게 검색하고 특정 제품이나 고객과 관련된 동향 패턴을 추출 할 수 있습니다.

거대한 데이터를위한 목록 화 단계

수백 개의 상점과 수천 명의 고객을 통해 패턴 식별에서 신제품 선택 및보다 타켓 화 된 마케팅 구현에 이르기까지 반복적 인 프로세스가 필요합니다. 큰 데이터 분석에서 흥미로운 것을 발견하면이를 체계화하여 비즈니스 프로세스의 일부로 만드십시오.

대형 데이터 분석과 운영 데이터 간의 관계를 성문화하려면 데이터를 통합해야합니다.

대용량 데이터 통합 ​​및 통합 단계

대용량 데이터는 데이터 통합을 비롯한 다양한 데이터 관리 측면에 큰 영향을 미치고 있습니다. 전통적으로 데이터 통합은 메시지 전달에 대한 사양 및 API (Application Programming Interface) 요구 사항을 포함하여 미들웨어를 통한 데이터 이동에 중점을 두었습니다. 이러한 데이터 통합의 개념은 모션중인 데이터가 아닌 데이터를 관리하는 데 더 적합합니다.

새로운 세계의 비정형 데이터 및 스트리밍 데이터로의 이전은 기존의 데이터 통합 ​​개념을 변화시킵니다. 스트리밍 데이터 분석을 비즈니스 프로세스에 통합하려는 경우 실시간으로 의사 결정을 내릴 수있을만큼 빠른 최신 기술이 필요합니다.

큰 데이터 분석이 완료되면 큰 데이터 분석 결과를 비즈니스 프로세스 및 실시간 비즈니스 활동에 통합하거나 통합 할 수있는 접근 방식이 필요합니다.

기업은 대용량 데이터 분석을 통해 실제 비즈니스 가치를 창출 할 수있는 높은 기대치를 가지고 있습니다. 실제로 많은 기업들은 기술 제한으로 인해 이전에는 불가능했던 보안 로그 데이터와 같은 내부적으로 생성 된 대용량 데이터를 더 자세히 분석하기를 원합니다. 대규모의 빠른 데이터를 고속으로 전송하기위한 기술은 분산 된 대용량 데이터 소스와 큰 데이터와 운영 데이터간에 통합하기위한 요구 사항입니다. 비 구조적인 데이터 소스는 공유 및 협업을 위해 넓은 지리적 거리에서 신속하게 이동해야하는 경우가 있습니다.

전통적인 소스를 큰 데이터와 연결하는 것은 큰 데이터 소스를 스트리밍하는 데 필요한 모든 데이터를보고 관련 패턴을 식별 한 후에 다단계 프로세스입니다. 관리 및 분석해야하는 데이터의 양을 줄인 후 이제 통합에 대해 생각해야합니다.

빅 데이터에 필요한 데이터 식별 - 더미

편집자의 선택

PowerPoint 2016의 다른 슬라이드에 하이퍼 링크를 만드는 방법 - PowerPoint 2016의

PowerPoint 2016의 다른 슬라이드에 하이퍼 링크를 만드는 방법 - PowerPoint 2016의

하이퍼 링크는 슬라이드 나 다른 프레젠테이션, Word 문서 나 Excel 스프레드 시트와 같은 다른 유형의 문서를 소환하기 위해 슬라이드를 볼 때 클릭 할 수있는 간단한 텍스트 또는 그래픽 이미지입니다. 하이퍼 링크를 클릭하면 페이지로 연결될 수도 있습니다.

PowerPoint 2007 슬라이드에서 작업 단추를 만드는 방법 - 동작 버튼 배치

PowerPoint 2007 슬라이드에서 작업 단추를 만드는 방법 - 동작 버튼 배치

PowerPoint 슬라이드에서 PowerPoint 슬라이드를 순서에 관계없이 볼 수 있으며 사운드 및 비디오 클립에 액세스 할 수 있습니다. PowerPoint 슬라이드에 단추를 추가하려면 단추를 배치 할 슬라이드로 이동하여 다음 단계를 따르십시오.

편집자의 선택

SAT 연습 문제 : SAT 수학 시험에서 여러 개의 그래프 - 더미

SAT 연습 문제 : SAT 수학 시험에서 여러 개의 그래프 - 더미

를 읽으면 질문이 생길 수 있습니다 하나의 그래프가 아니라 두 개를 포함합니다. 이러한 종류의 질문은 두 가지 그래프 사이의 관계를 탐구하도록 요구합니다. 다른 카운티의 차가운 시리얼 판매를 비교하는 다음 연습 질문에서와 같습니다. 연습 문제 두 가지 질문은 다음을 기반으로합니다 ...

SAT 연습 문제 : Sec, Csc 및 Cot Questions - 더미

SAT 연습 문제 : Sec, Csc 및 Cot Questions - 더미

SOH CAH TOA로 대표되는 삼각 비율의 경우 SAT Math 시험은 세컨드, 코사인 또는 코탄 센트로 작업해야하는 질문이있을 수 있습니다. 다행히도 사인, 코사인 또는 접선의 역수를 찾는 문제 일뿐입니다. 다음 연습 문제는 상호 작전을 수행하도록 요청합니다.

SAT 연습 문제 : 급진주의자를 포함하는 SAT 수학 시험에서 질문을 만났을 때 급식 문제 -

SAT 연습 문제 : 급진주의자를 포함하는 SAT 수학 시험에서 질문을 만났을 때 급식 문제 -

해결 , "9의 제곱근은 무엇입니까? "급진주의자는 그 질문의 한 부분 일 뿐이다. 다음 연습 문제는 위협적으로 보일지 모르지만 급진주의를 해결하는 방법을 알고 있다면 그 문제를 해결할 수 있습니다. 연습 ...

편집자의 선택

흑백 HDR : Photoshop Duotone 도구로 색상 화 - 더미

흑백 HDR : Photoshop Duotone 도구로 색상 화 - 더미

컬러링 (종종 색조 또는 색조라고도 함) 흑백 HDR 이미지는 흑백 이미지보다 하나, 둘 또는 그 이상의 색상을 오버레이하여 결과적으로 노화 또는 기타 창의적인 효과를냅니다. Photoshop에는 Elements (Colorizing, Color Variations 및 Color Layers)와 동일한 기능이 많이 있지만 강력한 제어 기능을 제공하는보다 강력한 사용자 기능이 제공됩니다.

HDR 파노라마의 프레임 혼합 - 더미

HDR 파노라마의 프레임 혼합 - 더미

혼합을 사용하면 Photoshop Elements가 어떻게 서로 다른 레이어를 HDR 파노라마를 만든 다음 합성하여 합성 이미지를 만듭니다. 이 프로세스는 파노라마의 한 프레임에서 어떤 것이 더 좋게 보이지만 그 지점이 다른 요소의 동일한 지점을 선호하도록 요소에 의해 마스크 된 경우에 유용합니다.

매크로 또는 클로즈업 사진 비율 - 대부분의 경우 더미

매크로 또는 클로즈업 사진 비율 - 대부분의 경우 더미

매크로와 클로즈업 사진 사이에는 상관이 없습니다. 피사체에 매우 가까이 다가 갈 수있는 능력이 있으면 작은 세부 사항을 밝히고 더 작은 피사체를 촬영할 수 있지만 피사체에 얼마나 가까이 다가 가느냐는 크기와 메시지에 비례합니다. 더 가까워서 항상 좋은 것은 아닙니다.