차례:
- 병합을 사용하여 데이터의 교차점을 찾는 방법
- 데이터 프레임과 일치하는 행만 유지하려면 인수 all = FALSE.
- 이 작업은 전체 병합을 수행하고 일치하는 데이터가없는 경우 NA 값으로 열을 채 웁니다.
비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2024
R에서는 merge () 함수를 사용하여 데이터 프레임을 결합합니다. 이 강력한 기능은 두 개의 서로 다른 데이터 프레임간에 공통적 인 행 또는 열을 식별하려고합니다.
병합을 사용하여 데이터의 교차점을 찾는 방법
가장 간단한 형태의 병합 ()은 서로 다른 두 데이터 집합 간의 교차점을 찾습니다. 즉, 콜드뿐만 아니라 커다란 상태로 구성된 데이터 프레임을 만들려면 기본 버전의 merge ()를 사용하십시오.
SQL과 같은 언어를 사용하는 경우 merge ()가 데이터베이스 조인과 매우 유사하다고 생각할 수 있습니다. 실제로, merge ()의 경우와 다른 인수를 통해 자연 조인과 왼쪽, 오른쪽 및 전체 외부 조인을 수행 할 수 있습니다.
x
:
-
A 데이터 프레임. : : 데이터 프레임.
-
에 의해 , x
-
, y : x와 y에 공통 인 열의 이름. 기본값은 두 데이터 프레임 사이에 공통 이름이있는 열을 사용하는 것입니다.
병합 유형을 지정하는 논리 값. 기본값은 모두 = FALSE (일치하는 행만 반환 됨)입니다. -
그 마지막 그룹의 논쟁 - 모두, 모두. x와 all. y - 약간의 설명이 필요합니다. 이러한 인수는 병합 유형을 결정합니다. 서로 다른 유형의 병합을 이해하는 방법 merge () 함수는 데이터를 결합하는 네 가지 방법을 허용합니다.
자연 조인:
데이터 프레임과 일치하는 행만 유지하려면 인수 all = FALSE.
완전 외부 조인:
-
두 데이터 프레임의 모든 행을 유지하려면 all = TRUE를 지정하십시오. 왼쪽 외부 조인:
-
데이터 프레임 x의 모든 행과 일치하는 y의 행만 포함하려면 all을 지정하십시오. x = TRUE. 오른쪽 외부 조인:
-
데이터 프레임 y의 모든 행과 일치하는 x의 행만 포함하려면 all을 지정하십시오. y = TRUE. 조합 찾기 (전체 외부 조인)
-
미국 주 예제로 돌아가서 차가운 상태와 큰 상태의 완전한 병합을 수행하려면 merge를 사용하고 all = TRUE: >> merge (cold (주, 대형, 주, 모두 = TRUE) 이름 프로스트 영역 1 알래스카 152 566432 2 애리조나 NA 113417 3 캘리포니아 NA 156361 … 13 텍사스 NA 262134 14 버몬트 168 NA 15 와이오밍 173 NA 두 데이터 프레임은 변수 이름, 그래서 R은 주 이름에 근거한 사례와 일치합니다.변수 Frost는 데이터 프레임을 차가운 것으로부터옵니다. 상태이고 변수 영역은 데이터 프레임 크기가 큽니다. 상태.