비디오: Summit Seoul '19 T2-4. Blob에서 Table까지: 데이터 저장에 대한 모든 것 (최유정) 2024
보안 및 개인 정보 보호 요구 사항, 큰 데이터 스택의 계층 1은 비슷합니다. 기존 데이터 환경에 대한 요구 사항 보안 요구 사항은 특정 비즈니스 요구 사항과 밀접하게 일치해야합니다. 대용량 데이터가 전략의 일부가되는 경우 몇 가지 고유 한 문제가 발생합니다.
-
데이터 액세스: 원시 또는 계산 된 빅 데이터에 대한 사용자 액세스는 비 빅 데이터 구현과 거의 동일한 수준의 기술 요구 사항을가집니다. 데이터는 합법적 인 비즈니스 필요성을 지니고 있거나 조사하고 상호 작용할 필요가있는 사람들에게만 제공되어야합니다. 대부분의 핵심 데이터 스토리지 플랫폼은 엄격한 보안 체계를 갖추고 있으며 페더레이션 ID 기능으로 보강되어 아키텍처의 여러 계층에 걸쳐 적절한 액세스를 제공합니다.
-
애플리케이션 액세스: 데이터에 대한 애플리케이션 액세스는 기술적 인 관점에서 보면 비교적 간단합니다. 대부분의 응용 프로그램 프로그래밍 인터페이스 (API)는 허가되지 않은 사용이나 액세스로부터 보호합니다. 이러한 보호 수준은 대부분의 대규모 데이터 구현에 적합합니다.
-
데이터 암호화: 데이터 암호화는 대용량 데이터 환경에서 가장 어려운 보안 측면입니다. 전통적인 환경에서 데이터 암호화 및 암호 해독은 시스템의 리소스를 실제로 강조합니다. 이 문제는 큰 데이터로 인해 악화됩니다. 가장 간단한 방법은 더 빠르고 더 빠른 계산 기능을 제공하는 것입니다. 보다 온화한 방법은이 보안 수준을 요구하는 데이터 요소를 식별하고 필요한 항목 만 암호화하는 것입니다.
-
물리적 인프라는 모든 것을 가능하게하고 보안 인프라는 큰 데이터 환경의 모든 요소를 보호합니다. 스택의 다음 단계는 기업 응용 프로그램에서 인터넷의 데이터 피드에 이르기까지 스택의 모든 구성 요소에 대한 양방향 액세스를 제공하는 인터페이스입니다.
이러한 인터페이스 설계의 중요한 부분은 기술 파트너 및 비즈니스 파트너뿐만 아니라 회사 내부와 외부에서 공유 할 수있는 일관된 구조를 만드는 것입니다.
수십 년 동안 프로그래머는 API를 사용하여 소프트웨어 구현에 대한 액세스를 제공했습니다. 도구 및 기술 공급자는 자신의 제품을 사용하여 새로운 응용 프로그램을 만드는 것이 비교적 간단한 작업임을 보장하기 위해 많은 노력을 기울일 것입니다.매우 도움이되지만 때로는 IT 전문가가 회사 전용의 맞춤 또는 독점 API를 만드는 것이 필요합니다.경쟁 우위, 조직 고유의 요구 또는 기타 비즈니스 요구 사항을 위해이 작업을 수행해야 할 수도 있지만 이는 간단한 작업이 아닙니다. API는 비즈니스 가치를 보존하기 위해 잘 문서화되고 유지 관리되어야합니다. 이러한 이유로 일부 회사는이 중요한 활동에 대한 시작을 얻기 위해 API 툴킷을 사용하기로 선택합니다.
API 툴킷은 내부적으로 개발 된 API에 비해 몇 가지 장점이 있습니다. 첫째, API 툴킷은 독립적 인 제 3자가 생성, 관리 및 유지 관리하는 제품입니다. 둘째, 특정 기술 요구 사항을 해결하도록 설계되었습니다.
큰 데이터 문제는 API 개발 또는 채택과 약간 다른 접근 방식을 필요로합니다. 데이터의 상당 부분이 구조화되어 있지 않고 비즈니스 제어 외부에서 생성되기 때문에 NLP (Natural Language Processing)라는 새로운 기술이 대용량 데이터와 응용 프로그램 간의 인터페이스를 위해 선호되는 방법으로 떠오르고 있습니다.
NLP를 사용하면 SQL과 같은 공식적인 쿼리 언어 대신 자연어 구문을 사용하여 쿼리를 공식화 할 수 있습니다. 가장 큰 규모의 데이터 사용자의 경우 미국 남동부에 거주하고 있으며 NASCAR의 팬인 30-40 세 사이의 모든 결혼 한 남성 소비자를 나열하는 것이 훨씬 쉽습니다. 30 회선 SQL 쿼리를 작성하는 것보다 쉽습니다.
대부분의 데이터 수집 및 이동은 매우 유사한 특성을 갖기 때문에 원하는 스토리지 시스템에 큰 데이터 항목을 수집, 정제, 변형, 정규화 및 저장하는 일련의 서비스를 설계 할 수 있습니다. 필요한만큼의 유연성을 생성하기 위해 공장은 XML (Extensible Markup Language)로 작성된 인터페이스 설명으로 구동 될 수 있습니다. 이러한 추상화 수준을 통해 각 데이터 소스에 대한 특정 서비스를 작성할 필요없이 특정 인터페이스를 쉽고 빠르게 작성할 수 있습니다.
실제로는 XML과 같은 것을 사용하여 SAP 또는 Oracle 애플리케이션 인터페이스에 대한 설명을 작성할 수 있습니다. 각 인터페이스는 동일한 기본 소프트웨어를 사용하여 SAP 또는 Oracle의 특성에 관계없이 큰 데이터 환경과 프로덕션 응용 프로그램 환경간에 데이터를 마이그레이션합니다. 인터넷상의 소셜 사이트에서 데이터를 수집해야하는 경우에도 마찬가지입니다.
XML로 사이트에 대한 인터페이스를 설명하고 서비스를 이용하여 데이터를 앞뒤로 이동하십시오. 일반적으로 이러한 인터페이스는 내부 및 외부 기술자가 사용할 수 있도록 문서화되어 있습니다.