비디오: r/youngpeopleyoutube Best Posts #8 2024
R의 cor () 함수는 여러 가지 방법으로 누락 된 데이터 값을 처리 할 수 있습니다. 이를 위해 인수 사용을 가능한 텍스트 값 중 하나로 설정합니다. use 인수의 값은 데이터 프레임에서 변수의 상관 관계를 계산할 경우 특히 중요합니다. 이 인수를 다른 값으로 설정하면
-
use = 'everything' 을 설정하여 모든 관측 값을 사용할 수 있습니다. 즉, 변수 중 하나에 NA 값이있는 경우 결과 상관 관계가 NA가됩니다. 이것이 기본값입니다.
-
하나 이상의 변수에 대해 NA 가있는 모든 관측치를 제외합니다. 이를 위해 use = 'complete'를 설정합니다. obs '. 누락 된 값이 전체 데이터 세트를 통해 확산되는 경우, 이는 단지 몇 가지 관찰을 남길 수 있습니다.
-
검사하는 모든 변수 쌍에 대해 NA 값으로 관측치를 제외합니다. 이를 위해 use = 'pairwise'인수를 설정합니다. 이렇게하면 다른 변수의 누락 값 때문에 정보를 잃지 않고 모든 변수 쌍에 대한 상관 관계를 계산할 수 있습니다.
실제로 서로 다른 상관 측정을 계산할 수 있습니다. 기본적으로 R은 표준 피어슨 상관 계수를 계산합니다. 정상적으로 분산되지 않은 데이터의 경우 cor () 함수를 사용하여 Spearman 순위 상관 관계 또는 Kendall의 타우를 계산할 수 있습니다. 이를 위해 메서드 인수를 적절한 값으로 설정해야합니다.