비디오: r/youngpeopleyoutube Best Posts #8 2024
용융 데이터 세트 (긴 포맷의 데이터 세트)가 있으면 R로 다시 만들 준비가 된 것입니다. 재구성하는 과정에서 모든 데이터를 그대로 유지하는 방법을 설명하려면 원본을 재구성하십시오: >> dcast (mgoals, Venue + Game ~ 변수, sum) 게임 장소 Granny Geraldine Gertrude 1 1 부 브뤼헤 12 5 11 2 2 겐트 4 4 5 3 3 번째 겐트 5 2 6 4 4 번째 브리 헤 6 4 7
dcast ()가 두 번째 인수로 수식을 취하는 방법을 볼 수 있습니까? 1 분 후에 그 점에 대해 자세히 알아보십시오.하지만 먼저 결과를 검사하십시오. 원본 데이터 프레임과 일치해야합니다.
dcast () 함수를 사용하여 녹은 데이터 프레임을 캐스팅합니다. 명확하게 말하면 긴 형식에서 넓은 형식으로 변환하는 데이 방법을 사용하지만 피벗 테이블의 작동 방식과 마찬가지로 중간 형식으로 집계 할 수도 있습니다.
dcast () 함수는
수식
-
: 데이터 전송 방법을 지정하는 수식입니다. 이 수식은 x_variable ~ y_variable 형식을 취합니다. 그러나 그것을 단순화하여 요점을 만듭니다. 여러 개의 x
-
- 변수, 여러 개의 y 변수 및 z 변수를 사용할 수 있습니다. 재미. 집계 : 캐스팅 수식이 데이터 집계 (예: length (), sum () 또는 mean ())로 나타나는 경우 사용할 함수입니다.
-
따라서 장소 대 플레이어의 요약을 얻으려면 dcast ()를 캐스팅 공식 변수 ~ Venue와 함께 사용해야합니다. 주조 공식은 용융 데이터 프레임의 열을 나타냅니다. >> dcast (mgoals, variable ~ Venue, sum) 변수 Bruges Ghent 1 Granny 18 9 2 Geraldine 9 6 3 Gertrude 18 11 원한다면 행과 행을 가로 지르는 장소를 가진 테이블을 얻고, 캐스팅 공식은 Venue ~ 변수 여야합니다: >> dcast (mgoals, Venue ~ 변수, sum) Venue Granny Geraldine Gertrude 1 Bruges 18 9 18 2 겐트 9 6 11 더 복잡한 주조 공식이 실제로 가능합니다. dcast ()에 대한 도움말 페이지에 따르면 캐스팅 수식은 다음 형식을 취합니다.
x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ …
각 차원의 여러 변수를 더하기 기호 (+), 물결표 (~)로 각 차원을 구분합니다. 또한 수식에 두 개 이상의 틸트가있는 경우 (즉,
z
- 변수가 포함 된 경우) 결과는 다차원 배열이됩니다.
그러므로 Venue, player (변수), Game별로 목표를 요약하려면 다음을 수행하십시오: >> dcast (mgoals, Venue + variable ~ Game, sum) 장소 변수 1st 2nd 3rd 3rd 4th 1 Bruges Granny 12 0 0 6 2 Bruges Geraldine 5 0 0 4 3 Bruges Gertrude 11 0 0 7 4 겐트 할머니 0 4 5 0 5 겐트 제랄딘 0 4 2 0 6 겐트 구르 트 르 데 0 5 6 0
long 형식의 데이터를 이해하는 것은 lattice 및 ggplot2 그래픽 패키지 모두 long 형식 데이터를 광범위하게 사용한다는 것입니다.이점은 서로 다른 하위 그룹을 비교하는 데이터 플롯을 쉽게 만들 수 있다는 것입니다.