비디오: 빅데이터가 말하는 꿈과 공부의 미래 | 최재원 다음소프트 이사 | 인생 강연 강의 듣기 | 세바시 817회 2024
큰 데이터 프로젝트를 수행 할 때 가장 중요한 고려 사항은 프로젝트를 수행하는 데 필요한 실시간 및 비 실시간의 예상 양입니다. 큰 데이터는 기술이 충분히 발전하지 않았거나 비용이 많이 들었 기 때문에 가능하지 않은 일을하는 경우가 많습니다. 큰 데이터에서 일어나는 큰 변화는 과거에 요구되었던 복잡한 프로그래밍 없이도 막대한 양의 데이터를 활용할 수있는 능력입니다.
많은 조직이 대량의 복잡한 데이터를 관리하는 측면에서 전환점에 서 있습니다. 큰 데이터 접근 방식은 상황을 균형있게 유지하여 데이터의 양, 다양성 및 속도가 변함에 따라 기업이 최우선 순위로 나아 가지 않도록합니다. 기업은 고속으로 관리해야하는 데이터 양을 관리하기가 어려웠습니다.
조직은 데이터가 드러날 수있는 전체 그림을 얻기 위해 종종 중요한 정보가 부족한 작은 데이터 하위 집합을 분석하여 해결해야했습니다. 거대한 데이터 기술이 발전하고 배포되면서 회사는 데이터를보다 쉽게 분석하고 결정을 내리고 조치를 취할 수 있습니다.
사기 / 정보와 같은 새로운 정보로 예외 모니터링새로운 제품 발표에 대한 고객의 반응과 같이 금융 시장에 영향을 줄 수있는 이벤트를 결정하기 위해 뉴스 피드 및 소셜 미디어를 모니터링합니다.
-
실시간 트위터 스트림을 기반으로 대규모 스포츠 이벤트 중에 광고 게재 위치 변경
-
판매 시점에서 구입 한 제품을 기준으로 고객에게 쿠폰 제공
-
때로는 스트리밍 데이터가 매우 빠르게 들어오고 다양한 출처를 포함하지 않는 경우가 있습니다. 때로는 다양성이 존재하며, 때로는 스트리밍 데이터가 둘.
-
실시간으로 이동하는 경우 스스로에게 묻는 질문은 다음과 같습니다. 기존의 정보 관리 기능으로이 문제를 해결할 수 있습니까? 아니면 새로운 기능이 필요합니까?얇은 볼륨이나 속도가 시스템을 압도 할 것입니까? 종종 그것은 두 가지를 조합 한 것입니다.
실시간 기능이 필요한 경우이 기능을 지원하기위한 인프라 요구 사항은 무엇입니까? 다음 목록은 데이터를 처리하여 처리하고 실시간으로 분석 할 수있는 시스템의 기능에 대해 고려해야 할 몇 가지 사항을 강조 표시합니다.
대기 시간:
대기 시간은 서비스가 환경에서 실행하라. 일부 응용 프로그램은 대기 시간이 적어 실시간으로 응답해야합니다. 실시간 스트림은 낮은 대기 시간을 필요로합니다. 따라서 네트워크 제약뿐만 아니라 컴퓨팅 성능에 대해서도 생각해야합니다.
-
확장 성: 확장 성은 증가하는로드에서도 일정 수준의 성능을 유지하는 기능입니다.
-
다양성: 시스템은 구조화 된 데이터 스트림과 구조화되지 않은 데이터 스트림을 모두 지원해야합니다.
-
네이티브 형식: 네이티브 형식으로 데이터를 사용합니다. 변화는 시간과 돈을 필요로합니다. 이벤트를 트리거하는 데이터에서 복잡한 상호 작용을 처리하는 아이디어를 사용하는 기능은 변형적일 수 있습니다. 끊임없이 증가하는 이질적인 데이터를 처리해야하는 필요성이 클라우드 서비스의 채택을 좌우하는 주요 요인 중 하나입니다. 클라우드 모델은 대규모이며 분산되어 있습니다.
-