차례:
- 큰 데이터를위한 인터페이스 및 피드
- 물리적 인프라는 분산 컴퓨팅 모델을 기반으로합니다. 이는 데이터가 여러 위치에 물리적으로 저장 될 수 있으며 네트워크, 분산 파일 시스템 사용 및 다양한 대형 데이터 분석 도구 및 응용 프로그램을 통해 서로 연결될 수 있음을 의미합니다.
- 데이터를 볼 수있는 사용자와 허용되는 상황을 고려해야합니다. 환자의 신원을 확인하고 환자 신원을 보호 할 수 있어야합니다.
- 문서, 그래프, 원주 및 지형 공간 데이터베이스 아키텍처를 비롯하여 대용량 데이터 환경에서 새로운 차원의 데이터 관리 접근법을 발견하게됩니다. 집합 적으로 이들은
비디오: '앱'으로 오래된 건축물 에너지 성능 진단 / YTN 2024
큰 데이터를 성공적으로 사용하려면 강력한 아키텍처 기반을 마련하는 것이 중요합니다. 기능 요구 사항을 지원하는 것 외에도 필요한 성능을 지원하는 것이 중요합니다. 귀하의 요구는 귀하가 지원하는 분석의 성격에 달려 있습니다. 올바른 계산 능력과 속도가 필요합니다.
예기치 못한 대기 시간과 다운 타임으로부터 보호 받으려면 아키텍처에 적절한 중복성이 있어야합니다.
다음 질문을 통해 시작하십시오.
-
귀사는 현재와 미래에 얼마나 많은 데이터를 관리해야합니까?
-
귀사는 얼마나 자주 실시간 또는 거의 실시간으로 데이터를 관리해야합니까?
-
귀사는 얼마나 많은 위험을 감당할 수 있습니까? 엄격한 보안, 컴플라이언스 및 거버넌스 요구 사항을 준수해야합니까?
-
데이터 관리의 속도가 얼마나 중요합니까?
-
데이터가 얼마나 정확합니까?
큰 데이터를위한 인터페이스 및 피드
실제 세계에서 얼마나 큰 데이터가 작동하는지 이해하려면 인터페이스 및 피드의 필요성을 이해하는 것이 중요합니다. 실제로 큰 데이터를 크게 만드는 것은 많은 소스에서 많은 양의 데이터를 가져 오는 것에 의존한다는 사실입니다.
대용량의 대용량 데이터 물리적 인프라 지원하는 물리적 인프라는 대규모 데이터 아키텍처의 운영 및 확장 성의 기본 요소입니다. 실제로 견고한 물리적 인프라가 없으면 커다란 데이터가 중요한 추세로 떠오르지 않았을 것입니다. 예기치 않거나 예측할 수없는 대량의 데이터를 지원하려면 큰 데이터의 물리적 인프라가 기존 데이터의 물리적 인프라와 달라야합니다.물리적 인프라는 분산 컴퓨팅 모델을 기반으로합니다. 이는 데이터가 여러 위치에 물리적으로 저장 될 수 있으며 네트워크, 분산 파일 시스템 사용 및 다양한 대형 데이터 분석 도구 및 응용 프로그램을 통해 서로 연결될 수 있음을 의미합니다.
많은 다른 소스의 많은 데이터를 다루기 때문에 중복성이 중요합니다. 중복성은 여러 형태로 제공됩니다. 회사에서 사설 클라우드를 만든 경우 사설 환경에서 리던던시를 구축하여 변화하는 워크로드를 지원하도록 확장 할 수 있습니다.
내부 IT 성장을 원할 경우 외부 클라우드 서비스를 사용하여 내부 리소스를 늘릴 수 있습니다. 경우에 따라 이러한 중복성은 기업이 서비스로서 정교한 데이터 분석을 수행 할 수 있도록 해주는 SaaS (Software as a Service) 형태로 제공 될 수 있습니다. SaaS 방식은 비용 절감, 신속한 시작 및 기본 기술의 원활한 발전을 제공합니다.
대용량 데이터 보안 인프라
대용량 데이터 분석이 기업에서 중요해질수록 그 데이터를 보호하는 것이 더 중요합니다. 예를 들어 건강 관리 회사 인 경우 큰 데이터 응용 프로그램을 사용하여 인구 통계의 변화 또는 환자 요구 사항의 변화를 파악하는 것이 좋습니다. 구성 요소에 관한이 데이터는 규정 준수 요건을 충족하고 환자의 개인 정보를 보호하기 위해 보호해야합니다.
데이터를 볼 수있는 사용자와 허용되는 상황을 고려해야합니다. 환자의 신원을 확인하고 환자 신원을 보호 할 수 있어야합니다.
운영비가 큰 데이터 소스
비즈니스를 완벽하게 파악하고 데이터 조작 방법이 비즈니스 운영 방식에 어떤 영향을 미치는지 확인해야하는 모든 데이터 소스를 통합해야한다는 것을 이해하는 것이 중요합니다. 세계가 변화함에 따라 운영 데이터는 이제 모든 형식의 소셜 미디어 데이터와 같은 비정형 소스를 포함하여 더 광범위한 데이터 소스 집합을 포괄해야한다는 것을 이해하는 것이 중요합니다.
문서, 그래프, 원주 및 지형 공간 데이터베이스 아키텍처를 비롯하여 대용량 데이터 환경에서 새로운 차원의 데이터 관리 접근법을 발견하게됩니다. 집합 적으로 이들은
NoSQL, 또는 SQL뿐 아니라 데이터베이스라고도합니다. 본질적으로 데이터 아키텍처를 트랜잭션 유형에 매핑해야합니다. 필요한 경우 올바른
데이터를 사용할 수 있는지 확인하는 데 도움이됩니다. 복잡한 비정형 콘텐트를 지원하는 데이터 아키텍처가 필요합니다. 큰 데이터를 활용하기 위해 관계형 데이터베이스와 비 관계형 데이터베이스를 모두 포함시켜야합니다. 또한 360도 비즈니스 관점에 가깝게 접근 할 수 있도록 컨텐츠 관리 시스템과 같은 구조화되지 않은 데이터 소스를 포함시켜야합니다. 이러한 모든 운영 데이터 소스는 공통적으로 다음과 같은 몇 가지 특징을 가지고 있습니다. 비즈니스의 실시간 운영에 필요한 중요한 데이터를 추적하는 기록 시스템을 나타냅니다.
비즈니스 단위 및 웹에서 발생하는 트랜잭션을 기반으로 지속적으로 업데이트됩니다.
-
이러한 소스가 비즈니스를 정확하게 표현하기 위해서는 구조화 된 데이터와 구조화되지 않은 데이터를 혼합해야합니다. 또한이 시스템은 일관되게 수천 명의 사용자를 지원할 수 있도록 확장 할 수 있어야합니다. 여기에는 트랜잭션 전자 상거래 시스템, 고객 관계 관리 시스템 또는 콜 센터 응용 프로그램이 포함될 수 있습니다.