개인 재정 R- 더미에서 데이터의 변형을 설명하는 방법

R- 더미에서 데이터의 변형을 설명하는 방법

차례:

비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2024

비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2024
Anonim

단일 번호는 귀하의 데이터에 대해 많이 알려주지 않습니다. 종종 데이터의 확산을 아는 것 또한 중요합니다. R을 사용하여 다양한 접근 방식을 사용하여이 스프레드를 볼 수 있습니다.

먼저, 분산 또는 표준 편차 를 계산하여 단일 숫자로 확산을 요약 할 수 있습니다. 이를 위해 분산에 대한 var ()와 표준 편차에 대한 sd () 함수가 있습니다. 예를 들어, 다음과 같이 데이터 프레임 자동차에서 mpg 변수의 표준 편차를 계산합니다.

>> sd (cars $ mpg) [1] 6. 026948
평균과 변이의 옆에, 당신은 또한 quantile을 볼 수 있습니다.

분위수, 또는 백분위 수는 데이터가 특정 값 아래에 얼마나 있는지 알려줍니다. 예를 들어, 50 % 분위수는 중앙값에 불과합니다. 다시 R에는 quantile을 보는 데 도움이되는 편리한 함수가 있습니다. R

에서 데이터 범위를 계산하는 방법 가장 많이 사용되는 분위수는 실제로 0 % 및 100 % 분위수입니다. 그것이 최소값과 최대 값이라고 쉽게 부르면됩니다. range () 함수를 사용하여 min () 및 max () 함수를 함께 얻을 수 있습니다. 이 기능은 편리하게 데이터 범위를 제공합니다. 따라서 모든 마일리지가 어떤 두 값 사이에 위치하는지 알기 위해서는 다음을 수행하십시오.

에서 데이터 사 분위수를 계산하는 방법 범위는 여전히 제한된 정보만을 제공합니다. 종종 통계 학자는 범위와 중앙값 옆의 첫 번째와 세 번째

분위

를보고합니다. 이 4 분위수는 각각 25 % W 75 % 분위수로, 데이터의 1 / 4 W 3/4가 더 작은 수입니다. 다음과 같이 quantile () 함수를 사용하여이 숫자를 얻습니다.

>> quantile (cars $ mpg) 0 % 25 % 50 % 75 % 100 % 10. 400 15. 425 19. 200 22. 800 33. 900 4 분위수는 동일하지 않습니다. 아래쪽 및 위쪽 힌지는 5 자리 요약으로 계산됩니다. 후자의 두 개는 각각 데이터의 하반부와 상반부의 중간 값이며 첫 번째와 세 번째 사 분위와 약간 다릅니다. 다섯 개의 숫자 통계를 얻으려면 fivenum () 함수를 사용하십시오. R

에서 quantile 함수로 속도를 얻는 법 quantile () 함수는 원하는 모든 quantile을 줄 수있다. 이를 위해 probs 인수를 사용합니다. 확률 (또는 확률)을 소수로 지정하십시오. 예를 들어, 20 % Quantile의 경우, 값의 인수로 20을 사용합니다.이 인수는 또한 벡터를 값으로 취하므로 예를 들어 >> quantile (cars $ mpg, probs = c (0.05,0.95))과 같이 5 %와 95 %) probs 인수의 기본값은 최소값 (0), 1 분위 (0.25), 중간 값 (0.5), 3 인수 값의 5 분의 1을 나타내는 벡터입니다. 4 분위 (0.75), 최대 (1)
이 모든 함수에는 인수 na가 있습니다. rm을 사용하면 각 통계를 계산하기 전에 모든 NA 값을 제거 할 수 있습니다. 이 작업을 수행하지 않으면 NA가 포함 된 벡터에는 NA가 결과로 나타납니다. 이것은 NA와 동일하게 작동합니다. rm sum () 함수의 인수.
R- 더미에서 데이터의 변형을 설명하는 방법

편집자의 선택

WordPress 링크 목록 구성 방법 - 더미

WordPress 링크 목록 구성 방법 - 더미

두 개 이상의 링크 목록을 원할 경우 워드 프레스 대시 보드. 때로는 Blogroll 제목 아래에 큰 링크 목록이있는 것은 너무 일반적이므로 링크를 추가 표제와 함께 표시하려는 경우가 있습니다. 기본적으로 ...

WordPress 블로그 용 미디어 파일 구성 방법 - 인형

WordPress 블로그 용 미디어 파일 구성 방법 - 인형

시간을 들여 블로그를 운영하면 WordPress 업 로더로 업로드 한 파일을 쉽게 잊어 버릴 수 있습니다. WordPress 미디어 라이브러리를 사용하면 어떤 파일이 업로드 폴더에 있는지 쉽게 찾을 수 있습니다. 이미 업로드 한 이미지, 비디오 또는 오디오 파일을 찾으려면 ...

검색 엔진 용 WordPress 블로그 최적화 방법 - 사람들이 찾고 싶어하는

검색 엔진 용 WordPress 블로그 최적화 방법 - 사람들이 찾고 싶어하는

귀하의 워드 프레스 블로그, 그렇지 않으면 그것을 쓰는 시간이 걸리지 않았을 것입니다. WordPress는 검색 엔진에 친숙한 환경을 조성하여 아카이브, 카테고리 및 페이지를 쉽게 탐색 할 수 있도록 해줍니다. WordPress는이 환경에 깨끗한 코드 기반을 제공하여 쉽게 업데이트 할 수 있습니다.

편집자의 선택

Access 2002에서 사라지는 기록의 수수께끼 - 더미

Access 2002에서 사라지는 기록의 수수께끼 - 더미

바로 거기! "그 문장의 핵심 단어는 동사입니다. 왜냐하면 그것은 그 기록이 지금 존재하지 않는다는 것을 나타 내기 때문입니다. 컴퓨터가 알고 있기 때문에 레코드가 어디로 갔는지 정확히 알 수 없으며 컴퓨터는 이러한 세부 사항에 대해 침묵의 코드를 가지고 있습니다. (규칙의 일부입니다 ...

데이터베이스 디자인 - 더미

데이터베이스 디자인 - 더미

여기에는 데이터베이스 디자인의 다섯 가지 계보가 있습니다. 또는 다른 데이터베이스 프로그램. 잘 설계된 데이터베이스는 데이터를보다 쉽게 ​​유지 관리합니다. 그것이 어디에 있는지, 그것이 나타나는 곳이 아닌 곳에 정보를 저장하십시오. 정보를 저장하는 곳은 정보가 나타나는 위치와 아무 관련이 없습니다. 스프레드 시트에서 원하는 위치에 정보를 입력합니다.

Access 2016에서 표 분석기를 사용하는 방법 - 인형

Access 2016에서 표 분석기를 사용하는 방법 - 인형

Access Table Analyzer는 가져온 스프레드 시트와 같이 지저분한 플랫 파일 테이블을 모든 반복적 인 데이터와 함께 사용하여 효율적인 관계형 테이블 집합으로 변환합니다. 그러나 속담처럼 약속은 깨진 약속입니다. 플랫 파일이 엄격한 규칙을 따르지 않는 한 ...

편집자의 선택

와이어 프레임을 사용하여 세 가지 글꼴 규칙을 따르십시오 계획 : 인포 그래피 - 인형을 사용하는 세 가지 글꼴 규칙을 따르십시오

와이어 프레임을 사용하여 세 가지 글꼴 규칙을 따르십시오 계획 : 인포 그래피 - 인형을 사용하는 세 가지 글꼴 규칙을 따르십시오

좋은 디자인의 향신료지만, 글꼴에 관해서라면, 현명한 디자이너는 충분히 충분한 지 알고 있습니다. 세 가지 서체를 사용하는 경우 인포 그래픽은 몸값 또는 커뮤니티 뉴스 레터처럼 보이게됩니다.

와이어 프레임 계획에 대한 전반적인 레이아웃 개념화 : Infographic - Dummies

와이어 프레임 계획에 대한 전반적인 레이아웃 개념화 : Infographic - Dummies

에 대한 전반적인 레이아웃 개념화 귀하의 인포 그래픽이 도움이 될 수 있도록 와이어 프레임에서 작업하지만 필수는 아닙니다. 정보를 수집하고 사용할 차트 및 삽화 유형에 대해 알고 있다면 전반적인 테마 또는 특정 레이아웃에 대한 몇 가지 아이디어가있을 수 있습니다. 표시된 주제 ...

와이어 프레임 계획 : 모든 다른 정보에 대한 확고한 생각을 갖고 나면 인포 그래피 - 인형 매핑 및 차단

와이어 프레임 계획 : 모든 다른 정보에 대한 확고한 생각을 갖고 나면 인포 그래피 - 인형 매핑 및 차단

귀하의 인포 그래픽에 필요한 그림 유형을 와이어 프레임에 배치하십시오. 정확한 게재 위치는이 단계에서는 중요하지 않지만 전체적인 크기와 각 그림 주위의 거리에 대한 느낌을 받기 시작해야합니다. 자리 표시 자 사용 - 대략적인 스케치 또는 더미 ...