차례:
비디오: ※R program 입문 통계분석(26회,Geom._point, geom._bar,geom._line 함수 )샘플 동영상,강좌,강의 2024
ggplot2의 매우 편리한 기능 중 하나는 플롯에서 R 데이터를 요약하는 기능 범위입니다. 즉, 종종 데이터를 미리 요약 할 필요가 없습니다. 예를 들어, 막대 그래프의 막대의 높이는 데이터에있는 관측치의 수를 나타냅니다.
이 통계 요약은 관측치를 세는 것입니다. 통계학자는이 프로세스를 binning 이라고하며 geom_bar ()의 기본 통계는 stat_bin ()입니다.
각 기하 구조가 연관된 기본 통계를 갖는 방식과 유사하게, 각 stat는 기본 기하 구조를가집니다.
그럼, 이것은 질문을 요구합니다: 기하 구조 또는 합계를 사용할지 여부를 어떻게 결정합니까? 이론 상으로는 기하 구조 또는 통계를 먼저 선택 하느냐가 중요하지 않습니다. 그러나 실제로는 일종의 플롯을 먼저 사용하는 것, 즉 기하 구조를 지정하는 것이 직관적 인 경우가 많습니다. 통계 요약의 다른 계층을 추가하려면 stat를 사용하십시오.
이 플롯에서 동일한 데이터를 사용하여 geom_point ()로 먼저 산점도를 만든 다음 stat_smooth ()로 부드러운 선을 추가했습니다.
stat 함수를 사용하는 몇 가지 실용적인 예를 살펴 보겠습니다.
Stat | 설명 | 기본 Geom |
---|---|---|
stat_bin () | 빈에있는 관측 수를 센다. | geom_bar () |
stat_smooth () | 부드러운 선을 작성합니다. | geom_line () |
stat_sum () | 값을 추가합니다. | geom_point () |
stat_identity () | 요약이 없습니다. 데이터를 그대로 플롯합니다. | geom_point () |
stat_boxplot () | 박스 - 위스커 플롯의 데이터를 요약합니다. | geom_boxplot () |
ggplot2에서 데이터를 비우는 법 |
ggplot2에서 R 데이터를 부드럽게하는 방법
ggplot2 패키지를 사용하면 데이터를 통해 회귀선을 매우 쉽게 만들 수 있습니다. stat_smooth () 함수를 사용하여이 유형의 행을 작성합니다.
stat_smooth ()에 대한 흥미로운 점은 기본적으로 로컬 회귀를 사용한다는 것입니다. R에는이를 수행 할 수있는 몇 가지 함수가 있지만 ggplot2는 로컬 회귀에 loess () 함수를 사용합니다. 즉, 선형 회귀 모델을 만들려면 stat_smooth ()에 다른 부드러운 함수를 사용하도록 지시해야합니다. 메서드 인수를 사용하여이 작업을 수행합니다.
부드럽게 사용하는 방법을 설명하기 위해 먼저 롱리 데이터 집합에 실업에 대한 산점도를 만듭니다. >> ggplot (longley, aes (x = Year, y = Employed)) + geom_point ()
다음 더 매끄럽게 만드십시오.이는 코드 줄에 stat_smooth ()를 추가하는 것만 큼 간단합니다. >> ggplot (longley, aes (x = Year, y = Employed)) + + geom_point () + stat_smooth ()
마지막으로 stat_smooth에게 선형 회귀 모델을 사용하도록 지시합니다. method = "lm"인수를 추가하여이 작업을 수행합니다.
ggplot2에게 데이터를 눈에 띄지 않게 남겨 두는 방법
때로는 (999) ggplot (longley, aes (x = Year, y = Employed)) + + geom_point () + stat_smooth ggplot2가 플롯에서 데이터를 요약하지 않도록하십시오. 이것은 대개 데이터가 사전 요약되어 있거나 데이터 프레임의 각 라인을 별도로 표시해야하는 경우에 발생합니다. 이 경우, ggplot2에게 아무 것도하지 말라고하고 싶고, stat는 이것을하기위한 stat_identity ()입니다.