차례:
- 에서 데이터 범위를 계산하는 방법 가장 많이 사용되는 분위수는 실제로 0 % 및 100 % 분위수입니다. 그것이 최소값과 최대 값이라고 쉽게 부르면됩니다. range () 함수를 사용하여 min () 및 max () 함수를 함께 얻을 수 있습니다. 이 기능은 편리하게 데이터 범위를 제공합니다. 따라서 모든 마일리지가 어떤 두 값 사이에 위치하는지 알기 위해서는 다음을 수행하십시오.
- 를보고합니다. 이 4 분위수는 각각 25 % W 75 % 분위수로, 데이터의 1 / 4 W 3/4가 더 작은 수입니다. 다음과 같이 quantile () 함수를 사용하여이 숫자를 얻습니다.
비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2024
단일 번호는 귀하의 데이터에 대해 많이 알려주지 않습니다. 종종 데이터의 확산을 아는 것 또한 중요합니다. R을 사용하여 다양한 접근 방식을 사용하여이 스프레드를 볼 수 있습니다.
먼저, 분산 또는 표준 편차 를 계산하여 단일 숫자로 확산을 요약 할 수 있습니다. 이를 위해 분산에 대한 var ()와 표준 편차에 대한 sd () 함수가 있습니다. 예를 들어, 다음과 같이 데이터 프레임 자동차에서 mpg 변수의 표준 편차를 계산합니다.
평균과 변이의 옆에, 당신은 또한 quantile을 볼 수 있습니다.
분위수, 또는 백분위 수는 데이터가 특정 값 아래에 얼마나 있는지 알려줍니다. 예를 들어, 50 % 분위수는 중앙값에 불과합니다. 다시 R에는 quantile을 보는 데 도움이되는 편리한 함수가 있습니다. R
에서 데이터 범위를 계산하는 방법 가장 많이 사용되는 분위수는 실제로 0 % 및 100 % 분위수입니다. 그것이 최소값과 최대 값이라고 쉽게 부르면됩니다. range () 함수를 사용하여 min () 및 max () 함수를 함께 얻을 수 있습니다. 이 기능은 편리하게 데이터 범위를 제공합니다. 따라서 모든 마일리지가 어떤 두 값 사이에 위치하는지 알기 위해서는 다음을 수행하십시오.
에서 데이터 사 분위수를 계산하는 방법 범위는 여전히 제한된 정보만을 제공합니다. 종종 통계 학자는 범위와 중앙값 옆의 첫 번째와 세 번째
분위
를보고합니다. 이 4 분위수는 각각 25 % W 75 % 분위수로, 데이터의 1 / 4 W 3/4가 더 작은 수입니다. 다음과 같이 quantile () 함수를 사용하여이 숫자를 얻습니다.
이 모든 함수에는 인수 na가 있습니다. rm을 사용하면 각 통계를 계산하기 전에 모든 NA 값을 제거 할 수 있습니다. 이 작업을 수행하지 않으면 NA가 포함 된 벡터에는 NA가 결과로 나타납니다. 이것은 NA와 동일하게 작동합니다. rm sum () 함수의 인수.