비디오: 아빠가 들려 주는 [인포그래픽] 짝 도수분포표 double histogram 2024
A 히스토그램 은 데이터 세트의 확률 분포를 나타내는 그래프입니다. 히스토그램에는 일련의 수직 막대가 있으며 각 막대는 단일 값 또는 변수의 값 범위를 나타냅니다. 막대의 높이는 다양한 값 또는 범위의 값에 대한 빈도 또는 확률을 나타냅니다.
예를 들어,이 그림은 2013 년 1 월 1 일부터 2013 년 12 월 31 일까지 애플 주식의 일일 가격의 막대 그래프를 보여줍니다.
이 막대 그래프에 따르면 가격의 대부분은 60 ~ 65 달러였습니다. 이 가격은이 기간 동안 81 번이었다. 두 번째로 자주 관찰되는 가격은 55 달러에서 60 달러 사이였습니다. 가격은이 기간에 44 번 상륙했다. 세 번째로 빈번한 가격대는 65 ~ 70 달러 였고 네 번째로 가장 많은 가격대는 70 ~ 75 달러였다. 극소수의 가격은 50 달러에서 55 달러 사이 였고, 1 년 동안 관찰 된 최저 가격은 80 달러에서 85 달러 사이였다.
그래프에 따르면 평균값과 중간 값은 $ 60 ~ $ 65에 가깝습니다. 실제 평균은 65 달러였습니다. 67이었고, 실제 중간 값은 63 달러였다. 65. 평균값이 중간 값을 초과하기 때문에 2013 년 가격 분포는 긍정적으로 왜곡되었다. 이것은 극단적으로 큰 가격의 가능성이 매우 낮은 가격의 가능성보다 다소 높다는 것을 나타냅니다. 평균값이 중앙값보다 큰 경우 분포가 양수로 기울어집니다. 평균이 중앙값보다 작 으면 부정적으로 왜곡됩니다. 평균이 중앙값과 같으면 분포는 평균에 대해 대칭입니다. 데이터가 비뚤어지는 정도는 평균과 중앙값이 얼마나 다른지에 따라 다릅니다. 이들이 매우 가깝다면, 분포를 대칭으로 취급하는 것이 가끔은 실용적입니다.
또 다른 예로,이 수치는 2013 년 1 월 1 일부터 2013 년 12 월 31 일까지의 S & P 500 주가 지수의 일별 히스토그램을 보여줍니다.S & P 500의 일일 가격 히스토그램
그림 12-10의 히스토그램에 따르면 올해 가장 자주 관찰 된 가격 범위는 $ 1,650와 $ 1,700 사이였습니다. 평균값은 $ 1, 643. 80이었고 중간 값은 $ 1, 650. 41. 애플 주식과는 달리 평균은 중앙값보다 작았 다. 2013 년의 가격 분포는 부정적으로 비뚤어졌습니다. 이것은 Standard & Poor 500이 평균보다 2013 년에 평균보다 낮게 거래되는 경향이 약간 있음을 나타냅니다. 히스토그램의 가장 중요한 용도 중 하나는 데이터 집합이 특정 확률 분포.데이터 세트가 어떤 확률 분포를 따르는지를 결정하기위한 많은 공식적인 통계적 테스트가 있지만 공식적인 통계 테스트에 참여하기 전에 그래프로 데이터를 시각적으로 검사하는 것이 좋습니다. 애플 가격의 막대 그래프는 애플 주식 가격이 정상적으로 분배되지 않는다는 강력한 증거를 제공한다. Apple의 주가는 긍정적으로 비뚤어지는 반면 정규 분포는 평균에 대해
대칭
입니다. S & P 가격의 막대 그래프는 S & P 500의 분포가 부정적으로 왜곡되어 있기 때문에 S & P 500이 정상적으로 분포하지 않을 것이라는 강력한 증거를 제공합니다. 두 가지 분포가 정상적인 것은 아니지만 그래프는 매우 암시적인 것으로 나타 내기 위해 공식적인 통계 테스트가 필요합니다. 많은 통계 테스트는 정상적인 가정을 기반으로하기 때문에 이러한 테스트를 사용하기 전에 배포가 실제로 정상적인 것인지를 결정하는 것이 중요합니다.