개인 재정 빅 데이터 환경의 비 구조적 데이터

빅 데이터 환경의 비 구조적 데이터

차례:

비디오: '빅데이터' 효율적인 관리 위해선... 2024

비디오: '빅데이터' 효율적인 관리 위해선... 2024
Anonim

비 구조적 데이터 는 큰 데이터에 대해 지정된 형식을 따르지 않는 데이터입니다. 기업에서 사용할 수있는 데이터의 20 %가 구조화 된 데이터이면 다른 80 %는 구조화되지 않은 것입니다. 구조화되지 않은 데이터는 실제로 발생할 수있는 대부분의 데이터입니다. 그러나 최근까지는 기술을 저장하거나 수동으로 분석하는 것 외에는 그다지 많은 도움이되지 않았습니다.

구조가없는 큰 데이터의 출처

비 구조적인 데이터는 어디 에나 있습니다. 실제로 대부분의 개인과 조직은 구조화되지 않은 데이터를 통해 삶을 영위합니다. 구조화 된 데이터와 마찬가지로 구조화되지 않은 데이터는 기계 생성 또는 사람 생성으로 생성됩니다.

컴퓨터에서 생성 된 비정형 데이터의 예는 다음과 같습니다.

  • 위성 이미지: 기상 데이터 또는 정부가 위성 감시 이미지에서 캡처 한 데이터가 포함됩니다. Google 어스에 대해 생각해 보면 그림을 얻을 수 있습니다.

  • 과학 데이터: 여기에는 지진 이미지, 대기 데이터 및 고 에너지 물리학이 포함됩니다.

  • 사진 및 비디오: 여기에는 보안, 감시 및 교통 비디오가 포함됩니다.

  • 레이더 또는 수중 음파 탐지기 데이터: 여기에는 차량, 기상 및 해양 지진 프로파일이 포함됩니다.

다음 목록은 사람이 생성 한 비정형 데이터의 몇 가지 예를 보여줍니다.

  • 귀사의 내부 텍스트: 문서, 로그, 조사 결과 및 전자 메일 내의 모든 텍스트를 생각하십시오. 기업 정보는 실제로 세계에서 텍스트 정보의 큰 비율을 나타냅니다.

  • 소셜 미디어 데이터: 이 데이터는 YouTube, Facebook, Twitter, LinkedIn 및 Flickr과 같은 소셜 미디어 플랫폼에서 생성됩니다.

  • 모바일 데이터: 여기에는 문자 메시지 및 위치 정보와 같은 데이터가 포함됩니다.

  • 웹 사이트 콘텐츠: YouTube, Flickr 또는 Instagram과 같은 비정형 콘텐츠를 제공하는 모든 사이트에서 제공됩니다.

그리고 그 목록은 계속됩니다.

어떤 사람들은 각 문서가 문서를 만든 소프트웨어를 기반으로하는 특정 구조 나 형식을 포함 할 수 있으므로 비정형 데이터 라는 용어가 잘못된 것이라고 생각하는 경우가 있습니다. 그러나 문서의 내부는 진정으로 구조화되어 있지 않습니다.

구조화되지 않은 데이터는 데이터 방정식 중 가장 큰 부분이며, 구조화되지 않은 데이터의 사용 사례는 급속히 확대되고 있습니다. 텍스트 측면에서만 텍스트 분석을 사용하여 구조화되지 않은 텍스트를 분석하고 관련 데이터를 추출하여 다양한 방식으로 사용할 수있는 구조화 된 정보로 변환 할 수 있습니다.

예를 들어, 대용량 데이터 사용 사례는 대용량 고객 대화 용 소셜 미디어 분석입니다. 또한 콜센터 메모, 전자 메일, 설문서의 서면 의견 및 기타 문서의 비정형 데이터를 분석하여 고객 행동을 이해합니다. 이는 수천만 가지 소스의 소셜 미디어와 결합하여 고객 경험을 이해할 수 있습니다.

대용량 데이터 관리에서 CMS의 역할

조직은 비정형 데이터를 데이터베이스에 저장합니다. 그러나 이들은 또한 콘텐츠의 전체 라이프 사이클을 관리 할 수있는 엔터프라이즈 콘텐츠 관리 시스템 (CMS)을 활용합니다. 여기에는 웹 콘텐츠, 문서 콘텐츠 및 기타 양식 미디어가 포함될 수 있습니다.

교육, 연구 및 모범 사례를 제공하는 비영리 단체 인 정보 및 이미지 관리 협회 (AIIM)에 따르면 ECM (Enterprise Content Management)은 다음과 같은 "전략, 방법 및 도구를 포함합니다. 조직 프로세스와 관련된 컨텐츠 및 문서를 저장, 보존 및 전달할 수 있습니다. "ECM에 포함 된 기술에는 문서 관리, 기록 관리, 이미징, 워크 플로우 관리, 웹 콘텐츠 관리 및 공동 작업이 포함됩니다.

전체 산업은 컨텐츠 관리와 관련하여 성장해 왔으며 많은 컨텐츠 관리 업체들은 방대한 양의 비정형 데이터를 처리하기 위해 솔루션을 확장하고 있습니다. 그러나 새로운 기술은 구조화되지 않은 데이터와 구조화되지 않은 데이터의 분석을 지원하기 위해 진화하고 있습니다. 이들 중 일부는 구조화 된 데이터와 비정형 화 된 데이터를 모두 지원합니다. 일부는 실시간 스트림을 지원합니다. 여기에는 Hadoop, MapReduce 및 스트리밍과 같은 기술이 포함됩니다.

콘텐츠 관리 시스템의 형태로 콘텐츠를 저장하도록 설계된 시스템은 더 이상 독립 실행 형 솔루션이 아닙니다. 오히려 전체 데이터 관리 솔루션의 일부가 될 가능성이 큽니다. 예를 들어 조직에서 프로그래밍 방식으로 CMS 검색을 시작할 수있는 Twitter 피드를 모니터링 할 수 있습니다.

이제 트윗을 실행 한 사람이 답을 얻고 나면 사용자가 찾고있는 제품을 찾을 수있는 위치를 제공합니다. 가장 큰 이점은이 유형의 상호 작용이 실시간으로 발생할 수있는 경우입니다. 또한 구조화되지 않은 실시간 (트위터 사용자에 대한 고객 데이터) 및 세미 구조 (CMS의 실제 내용) 데이터를 활용하는 가치를 보여줍니다.

실제로는 큰 데이터 문제를 해결하기 위해 하이브리드 방식을 사용하게 될 것입니다. 예를 들어, 구조화되지 않은 데이터를 관리하는 데 도움이되기 때문에 모든 뉴스 콘텐츠를 예를 들어 건물의 Hadoop으로 이동하는 것은 의미가 없습니다.

빅 데이터 환경의 비 구조적 데이터

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...