차례:
- 큰 데이터에 대한 태도
- 대용량 데이터를위한 클라리 브리지 (Clarabridge)
- 대용량 데이터 용 IBM
- 큰 데이터를위한 OpenText
- SAS는 오랫동안 복잡한 대용량 데이터 문제를 해결해 왔습니다. 몇 년 전, 텍스트 분석 업체 인 Teragram을 인수하여 구조화 및 비정형 데이터를 분석에 사용하고 설명 및 예측 모델링에이 데이터를 통합하는 전략을 강화했습니다. 이제 텍스트 분석 기능은 전체 분석 플랫폼의 일부이며 텍스트 데이터는 단순히 다른 데이터 소스로 간주됩니다. SAS는 성능 분석이 고객 기대에 부응 할 수 있도록 지속적으로 혁신하고 있습니다. 목표는 몇 일 안에 해결하고 해결하기 위해 몇 주가 걸렸던 문제를 해결하는 것이 었습니다.
비디오: 김현중: 노가다 없는 텍스트 분석을 위한 한국어 NLP 2024
다음은 텍스트 분석 빅 데이터 시장의 일부 선수에 대한 개요입니다. 일부는 작고 다른 것은 가명입니다. 어떤 이들은 큰 데이터 텍스트 분석 , 을 호출하지만 일부는 텍스트 분석이라고합니다.
큰 데이터에 대한 태도
Attens는 10 년 이상 전에 제품을 개발하고 판매 한 최초의 텍스트 분석 회사 중 하나입니다. 현재 150여 기업 고객과 세계 최대 규모의 NLP 개발 그룹 중 하나입니다. Attensity는 텍스트 분석을위한 여러 엔진을 제공합니다. 여기에는 자동 분류, 엔티티 추출 및 철저한 추출이 포함됩니다. Exhaustive Extraction은 구문 분석 된 텍스트에서 사실을 자동으로 추출하고이 정보를 구성하는 Attensity의 주력 기술입니다.
회사는 내부 및 외부 소스에서보고 할 텍스트를 분석 한 다음이를 비즈니스 사용자에게 전달하여 참여를 유도함으로써 사회적 및 다중 채널 분석 및 참여에 중점을 둡니다. 소셜 미디어 회사 인 Biz360은 최근 거대한 소셜 미디어 스트림을 모았습니다. 방대한 양의 실시간 텍스트를 처리 할 수있는 고성능 기능을 제공하는 그리드 컴퓨팅 시스템을 개발했습니다.
Attensity는 Hadoop 프레임 워크를 사용하여 데이터를 저장합니다. 또한 인바운드 데이터에서 스파이크를 인식하고 필요에 따라 더 많거나 적은 서버에서 처리를 조정하는 오케스트레이션 프로세스를 만드는 데이터 대기열 시스템이 있습니다.
대용량 데이터를위한 클라리 브리지 (Clarabridge)
또 다른 순수 텍스트 분석 공급 업체 인 클라라 브리지는 실제로 구조화되지 않은 데이터를 처리 할 필요성을 인식 한 비즈니스 인텔리전스 (BI) 컨설팅 회사 (클라라 뷰)의 분사입니다. 이 회사의 목표는 고객이 전체적으로 고객을보고 핵심 경험 및 문제를 정확히 파악하고 조직의 모든 구성원이 실시간으로 조치를 취하고 공동 작업하도록 도와줌으로써 기업이 측정 가능한 비즈니스 가치를 창출하도록 돕는 것입니다.
->여기에는 고객 피드백 데이터 / 텍스트의 정서 및 분류를 실시간으로 결정하고 Clarabridge 시스템에 향후 처리를 위해 축 어적으로 스테이징이 포함됩니다.
Clarabridge는 고객에게 신제품과 관련된 텍스트 피드, 감정 또는 만족도의 변화를 일으키는 원인을 파악할 수있는 단일 클릭 근본 원인 분석을 비롯하여 고객에게 정교하고 흥미로운 기능을 제공합니다. 또한 SaaS (Software as a Service)와 같은 솔루션을 제공합니다.
대용량 데이터 용 IBM
소프트웨어 거인 IBM은 Smarter Planet 전략에 따라 텍스트 분석 분야에서 여러 솔루션을 제공합니다.Watson과 IBM SPSS는 제외하고 IBM은 Enterprise Search를 갖춘 IBM Content Analytics도 제공합니다. IBM Content Analytics는 IBM Research에서 수행 한 작업을 기반으로 개발되었습니다.
IBM Content Analytics는 컨텐츠를 분석 정보로 변환하는 데 사용되며 BI 툴 세트에서 구조화 된 데이터를 분석하는 방식과 유사한 자세한 분석에 사용할 수 있습니다. IBM Content Analytics와 Enterprise Search는 한때 두 개의 별도 제품이었습니다.
통합 솔루션은 독립형 컨텐츠 분석 요구뿐만 아니라 텍스트 분석을 사용하는 향상된 엔터프라이즈 검색을 모두 대상으로합니다. ICAES는 IBM InfoSphere BigInsights 플랫폼과 긴밀하게 통합되어 매우 큰 검색 및 컨텐츠 분석 콜렉션을 가능하게합니다.
큰 데이터를위한 OpenText
캐나다 기반 회사 인 OpenText는 아마도 기업 정보 관리 솔루션 분야에서 그 리더십으로 가장 잘 알려져있을 것입니다. 비전은 조직화되지 않은 기업 데이터의 관리, 보안 및 가치 창출에 중점을 둡니다. 의미 적 미들웨어라는 용어를 제공합니다. 이 회사에 따르면 시맨틱 기술의 진화는 언어, 형식 및 업계 도메인 전반에 걸쳐 대규모 데이터 세트에 대해 높은 정확도로 실시간 분석을 가능하게하는 기능에 뿌리를두고 있습니다. "시맨틱 미들웨어의 개념은 시맨틱을 다양한 수준에서 노출시킬 수 있고 비즈니스 문제를 해결하기 위해 다양한 기술로 작업 할 수 있다는 것입니다.
즉, 필요한 경우 텍스트 분석을 활성화하고 활용할 수 있습니다.
대용량 데이터 용 SAS
SAS는 오랫동안 복잡한 대용량 데이터 문제를 해결해 왔습니다. 몇 년 전, 텍스트 분석 업체 인 Teragram을 인수하여 구조화 및 비정형 데이터를 분석에 사용하고 설명 및 예측 모델링에이 데이터를 통합하는 전략을 강화했습니다. 이제 텍스트 분석 기능은 전체 분석 플랫폼의 일부이며 텍스트 데이터는 단순히 다른 데이터 소스로 간주됩니다. SAS는 성능 분석이 고객 기대에 부응 할 수 있도록 지속적으로 혁신하고 있습니다. 목표는 몇 일 안에 해결하고 해결하기 위해 몇 주가 걸렸던 문제를 해결하는 것이 었습니다.
예를 들어, SAS High Performance Analytics Server는 집계 데이터의 하위 집합이 아닌 완전한 데이터를 사용하여 분석 모델을 개발할 수있는 인 메모리 솔루션입니다. SAS는이 분석의 일환으로 수천 개의 변수와 수백만 개의 문서를 사용할 수 있다고 말합니다. 이 솔루션은 Hadoop 분산 파일 시스템 (HDFS)을 사용하는 범용 하드웨어는 물론 EMC Greenplum 또는 Teradata 어플라이언스에서도 실행됩니다.