비디오: 비즈니스 실무자를 위한 데이터 분석여행 워밍업1단계 데이터불러오기 요약 2024
인류는 점차 작아지고 강력한 하드웨어로 생성되는 전례없는 많은 양의 데이터의 교차로에 있으며 알고리즘은 동일하게 분석됩니다 프로세스가 개발에 도움이되었습니다. 이는 단순히 볼륨의 문제가 아니라 어려운 문제입니다.
2001 년 리서치 회사 가트너 (Gartner)가 공식화하고 IBM과 같은 다른 회사에 의해 다시 작성되고 확장됨에 따라 큰 데이터는 라는 주요 특성을 나타내는 네 개의
로 요약 할 수 있습니다. ->- 볼륨: 데이터 양
- 속도: 데이터 생성 속도
- 다양성: 데이터 소스의 수와 유형
- : 데이터의 품질 및 권위있는 목소리 (오류, 양질의 데이터 및 신호와 혼합 된 잡음)는 데이터의 불확실성을 측정합니다. 각 큰 데이터 특성은 도전과 기회를 제공합니다. 예를 들어, 볼륨은 유용한 데이터의 양을 고려합니다. 하나의 조직이 큰 데이터를 다른 데이터의 작은 데이터로 간주 할 수 있습니다. 단일 시스템에서 데이터를 처리 할 수 없다고해서 데이터가 커지지는 않습니다. 큰 데이터를 비즈니스에서 평소와 다른 데이터와 차별화하는 이유는 조직이 널리 퍼져있는 방법과 솔루션을 수정하도록하고 기존의 기술과 알고리즘을 보완해야하기 때문입니다.
Wired
의 편집장 인 크리스 앤더슨 (Chris Anderson)이 저술 한 많은 저서와 이정표에 의해 설명 된 바와 같이, 다양성은 과학적 방법에 큰 데이터를 사용할 수있게 해줍니다 당시에는 많은 양의 데이터가 과학적 방법 밖에 과학적 발견을 도울 수있는 방법에 대해 저자는 특정 모델이나 이론을 사용하지 않고도 눈에 띄는 역할을 할 수있는 광고 및 번역 비즈니스 분야에서 Google의 사례를 사용하지만 데이터에서 배우는 알고리즘을 적용하여 사용합니다. 광고에서와 마찬가지로 과학 (물리학, 생물학) 데이터는 과학자가 가설없이 문제에 접근 할 수있게 해주는 혁신을 지원할 수 있지만 많은 양의 데이터 및 발견 알고리즘에 의해 발견되는 변화를 고려하면 가능합니다.