R - 개인 재정 2025

비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2025

데이터 집합에 대한 간략한 개요가 필요한 경우 물론 R 명령을 항상 사용할 수 있습니다 str ()을 호출하고 구조를 살펴 봅니다. 그러나 이것은 변수의 클래스와 관측 수에 대해서만 알려줍니다. 또한, head () 함수는 데이터를 데이터 집합에 저장하는 방법에 대한 아이디어를 제공합니다.

출력을 얻는 방법

데이터 집합에서 변수 분포를 더 잘 이해하려면 summary () 함수를 다음과 같이 사용할 수 있습니다.

>> 요약 (자동차) mpg cyl am gear Min.: 10. 40 분.: 4. 000 자동: 13 3: 15 1 Qu.: 15. 43 1 Qu.: 4. 000 설명서: 19 4: 12 중앙값: 19. 20 중앙값: 6. 000 5: 5 평균: 20. 09 평균: 6. 188 3 Qu.: 22. 80 3 Qu.: 8. 000 Max.: 33. 90 Max.: 8.000

summary () 함수는 명령 행에서 R을 대화식으로 사용하여 데이터 세트를 빠르게 스캔하는 경우에 가장 잘 작동합니다. 자신이 작성한 사용자 정의 함수 내에서 사용하지 마십시오.

숫자 변수:

summary ()는 범위, 사 분위수, 중앙값 및 평균.

요인 변수: summary ()는 빈도가있는 표를 제공합니다.
수치 변수 및 요소 변수: summary ()는 누락 된 값이있는 경우 그 수를 제공합니다.
문자 변수:
summary ()는 길이와 클래스 ('문자')를 제외하고는 어떤 정보도 제공하지 않습니다.
문제 해결 방법 변수 cyl에 이상한 값을 보았습니까? 요약을 간략히 보면 예를 들어 최소값과 1 분위 값이 정확히 같은 값을 갖기 때문에 생기는 현상이 있음을 알 수 있습니다. 실제로 변수 cyl에는 세 가지 값만 있으며 요인으로 더 좋을 것입니다. 그래서 변수를 그 불행에서 벗어나게하십시오: >> cars $ cyl <- as. 요인 (자동차 $ cyl)