차례:
- 사건이 발생할 확률을 안다.
- 변화의 정도를 보여주기 위해 분산 적용
- 예측을 계산할 때 특정 양의 기록 데이터를 사용하여 행동, 특정 이벤트 또는 추세를 예측합니다. 예를 들어, 1 월이 일반적으로 매출의 5 %를 차지하는 역사적인 사실을 토대로 해당 연도의 매출을 계산할 수 있습니다. 1 월에 $ 500의 매출을 올린 경우 다음 공식을 사용하여 해당 연도의 예상 판매량을 예측할 수 있습니다.
비디오: 최고의 수학교실 - 수학적 분석 능력 키우는 통계활용 수업_#002 2024
통계 라는 단어는 일부 초보자에게서 데이터 시각화에 대한 두려움을 불러 일으킬 수 있지만이 주제를 무시하면 Big Data에서 진정한 통찰력과 가치를 창출하는 가장 강력한 방법.
통계 는 수치 데이터를 대량으로 수집하는 실습 또는 과학입니다. 당신은 나가서 데이터 과학자가 될 필요가 없습니다 (변호사의 데이터 괴짜이며 보통 PhD와 같은 고급 학위를 소지 한 통계 학자에게 사용되는 용어 임). 관심이 있다면 Statistics 101 책이나 수업.
오늘날 확률, 분산 및 예측과 같은 통계 공식이 많이 사용됩니다. 모든 데이터 세트에 적용하기가 쉽고 대부분의 독자가이를 분명히 이해합니다. 이러한 통계 수식 중 일부를 빅 데이터 시각화에 통합하여 다음 섹션에서 설명하는 기술을 사용하여 사용자에게 진정한 가치를 제공 할 수 있습니다.
사건이 발생할 확률을 안다.
친숙한 통계 수식은 p robability - 이벤트가 발생할 가능성 또는 기회입니다. 다음 수식은 선형 시나리오의 기본 확률을 계산합니다. (비선형 시나리오는 초보자에게는 약간 복잡하고 너무 많은 작업입니다.)
확률 = 이벤트 발생 가능성 / 가능한 결과 수
다음 그림은 경고 색상이 추가되어 확률이 높아지는 확률을 보여줍니다. 메시지를 읽기 쉽고, 가장 중요한 것은 즉각적인 조치가 필요함을 명확히 나타 내기위한 것입니다.
확률은 특정 기간 (일, 주, 분기 등) 동안 데이터 시각화가 제공 할 스토리에 대한 빠른 현실 확인을 제공하고 전반적인 톤을 설정합니다.
변화의 정도를 보여주기 위해 분산 적용
또 다른 대중적인 통계 척도는 데이터 포인트 집합 간의 차이 인 입니다. 분산을 계산하는 데 가장 일반적으로 사용되는 수식은 분산 = 최종 원하는 - 현재 상태 표시되는 출력이 정수인지 백분율인지에 관계없이 수식은 시작과 끝 사이의 변화의 크기를 보여줍니다. 데이터 포인트.
분산을 표시하는 것은 항상 빠른 승리이며, 대부분의 시각화에서 분산 관계가 표시되는 방법 인 선 / 막대 차트 조합을 대체 할 수 있습니다.
아래 그림의 차트는 매월 분산을 해독 할 수있는 줄 / 막 대형 차트 조합을 보여줍니다.
다음 그림에 표시된 두 번째 차트는 분산을 명확하게 나타내며 모든 추측을 시각적으로 제거합니다.
미래 예측
익숙한 또 다른 인기있는 통계 공식은 이벤트 또는 추세를 예측하거나 추정하는
f 999입니다.
예측을 계산할 때 특정 양의 기록 데이터를 사용하여 행동, 특정 이벤트 또는 추세를 예측합니다. 예를 들어, 1 월이 일반적으로 매출의 5 %를 차지하는 역사적인 사실을 토대로 해당 연도의 매출을 계산할 수 있습니다. 1 월에 $ 500의 매출을 올린 경우 다음 공식을 사용하여 해당 연도의 예상 판매량을 예측할 수 있습니다.
$ 500 /. 05 = $ 10, 000 이 방정식에서 $ 500은 1 월의 판매량입니다.. 05는 1 월이 차지하는 매출의 역사적 비율입니다. $ 10, 000은 그 해의 예상 판매량입니다. 아래 그림은 대부분의 데이터 시각화에서 예측이 차트의 간단한 선으로 표시되는 방법을 보여줍니다. 예측은 주어진 활동이 미래에 어떻게 수행 될 수 있는지를 나타냅니다. 이러한 예측 라인의 전형적인 디스플레이는 결국 현금 흐름이이 조직의 문제가 될 것임을 보여줍니다.