줄기와 잎 플롯과 달리 산점도 는 두 변수 간의 관계를 보여줍니다. 원시 데이터를 살펴 보는 것만으로 두 변수 사이의 관계가 있는지 여부를 확인하는 것은 어려울 수 있지만, 분산 형 플롯을 사용하면 데이터에 존재하는 패턴을 훨씬 쉽게 볼 수 있습니다.
분산 형 플롯은 일련의 점으로 구성됩니다. 각 점은 두 개의 다른 변수에 대한 단일 값을 보여줍니다. 예를 들어, 기업의 연간 매출액과 연간 이익 간의 관계를 보여주는 산점도를 만들 수 있습니다. 수익을 기준으로 수익을 예측하려는 경우 X 축은 연간 수익을 표시하는 데 사용되고 Y 축은 연간 수익을 표시하는 데 사용됩니다. 따라서 수익은 독립 변수로 간주되며 이익은이 관계에서 종속 변수로 간주됩니다.
분산 형 플롯에서 X 축 (즉, 가로 축)을 사용하여 독립 변수 를 표시하고 Y 축 (세로 축) 종속 변수 를 표시하는 데 사용됩니다.
이 예에서 분산 형 플롯의 각 점은 지정된 연도의 매출 및 판매를 표시합니다. 이 표는 2004-2014 년 동안 기업의 연간 수익과 연간 이익 간의 관계를 보여줍니다.
연도
매출 ($ 수백만) |
이익 ($ 수백만) |
2004 |
225 |
42 > 2005 999 237 999 2006 999 245 914 489 999 222 999 265 999 60 999 2009 270 999 2010 999 254 999 2011 999 280 999 2012 999 299 999 2013 > 305 |
65 |
2014 |
312 |
|
- 3 -> |
다음 그림은 결과 산포도를 보여줍니다. |
2004-2014 년 연간 수입과 이익의 산탄도. |
산점도의 각 점은 1 년 동안 기업의 수입과 관련 이익을 나타냅니다. 예를 들어, 플롯의 오른쪽 상단 구석에있는 지점은 기업의 매출이 3 억 1,200 만 달러이고 이익이 7100 만 달러였던 2014 년의 데이터를 나타냅니다. |
산포도를 사용하여 |
두 변수가 같은 방향으로 움직이는 지 여부를 결정할 수 있습니다. 두 변수는 반대 방향으로 움직이는 경향이있다. |
두 변수는 서로 관련이 없습니다. 두 변수가 같은 방향으로 움직이는 경향이 있다면, 양 변수는 양의 상관 관계가 있다고합니다. 반대 방향으로 움직이는 경향이 있다면, |
는 부정적으로 연관되어 있다고한다.두 변수가 특정 패턴을 나타내지 않는다면, 그들은 상관 관계가 없다고 말해진다. |
이 그림은 양의 상관 관계가있는 두 변수 (X 및 Y)에 대한 산점도를 보여줍니다. |
양의 상관 관계가있는 변수의 산점도. |
산점도는 X가 증가함에 따라 Y가 증가하는 경향이 있음을 보여줍니다 (반드시 같은 양은 아니지만). 이것은 X와 Y가 양의 상관 관계가 있음을 보여줍니다. |
다음 그림은 |
추세선이있는 동일한 산점도를 보여줍니다. |
회귀 방정식은 |
회귀 분석으로 추정됩니다. |
양의 상관 관계가있는 변수와 추세선의 산점도. |
추세선은 X의 특정 변화에 따라 Y가 평균적으로 얼마나 많이 변하는지를 보여줍니다. 긍정적으로 기울어 진 추세선은 두 변수가 양의 상관 관계가 있음을 나타냅니다. 마찬가지로 음의 기울기가있는 추세선은 두 변수가 음의 상관 관계가 있음을 나타냅니다. 추세선이 평평한 경우 (즉, 기울기가 0 인 경우) 두 변수가 서로 관련이 없음을 나타냅니다. 긍정적으로 기울어 진 경향 선은 X와 Y가 양의 상관 관계가 있음을 보여줍니다. |
다음 그림은 산점도와 부정적인 |
상관 관계가있는 두 변수의 경향 선을 보여줍니다. |
두 개의 음의 상관 관계가있는 변수의 추세선과의 산포도. |
산점도는 X가 증가하면 Y가 감소하는 경향이 있음을 보여줍니다. 경향 선의 기울기는 |
음의 |
입니다. 따라서, X와 Y는 부정적으로 상관 관계가있다 (999). |
다음 그림은 산점도와 상관 관계가없는 두 변수의 추세선을 보여줍니다. |
트렌드 라인이있는 두 개의 상관되지 않은 변수의 분산 형 도표. |
산점도는 X가 증가함에 따라 Y가 가끔씩 증가하고 때로는 감소한다는 것을 보여줍니다. 데이터에는 특별한 패턴이 없습니다. 포인트는 다이어그램 전체에 무작위로 흩어져있는 것처럼 보입니다. 결과적으로 추세선은 거의 평평 해지고 X와 Y는 상관 관계가없는 것으로 나타납니다. |
실제 사례에서이 수치는 2013 년 1 월 1 일부터 2013 년 12 월 31 일까지 애플 주식 가격과 스탠더드 앤드 푸어스 500 주가 지수 사이의 관계에 대한 산포도를 보여줍니다. |
(S & P 500) 지수는 500 대 미국 주식의 평균 가격이다. 이 지수의 가치는 미국 경제의 전반적인 상태를 반영합니다. 플롯은 애플 주식과 S & P 500의 가격간에 양의 상관 관계가 있음을 보여줍니다.