비디오: r/youngpeopleyoutube Best Posts #8 2024
데이터를 부분 집합으로 만드는 매우 유용한 응용 프로그램은 중복 값을 찾아서 제거하는 것입니다. R에는 중복 된 값을 찾고 특정 값이 이전 값의 복제본인지 여부를 알려주는 논리 벡터를 반환하는 유용한 함수 duplicated ()가 있습니다. 즉, 중복 된 값의 경우 duplicated ()는 첫 번째 발생시 FALSE를 반환하고 다음 예제와 같이 해당 값이 발생할 때마다 TRUE를 반환합니다.
데이터 프레임에서 이것을 시도하면 R은 자동으로 관측을 검사합니다 (즉, 모든 행을 값으로 처리 함). 예를 들어 데이터 프레임 홍채의 경우: >> 중복 (홍채) [1] 거짓 거짓 거짓 거짓 거짓 거짓 거짓 거짓 거짓 [10] 거짓 거짓 거짓 거짓 거짓 거짓 거짓 거짓 … 거짓 [거짓] 거짓 거짓 FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE주의 깊게 살펴보면 결과의 143 번째 요소에 TRUE 값이 있기 때문에 행 143이 중복되었음을 알 수 있습니다. 또한 which () 함수를 사용하여이를 알 수 있습니다.
>> (중복 (홍채)) [1] 143
이제 홍채에서 복제본을 제거하려면이 행을 데이터에서 제외해야합니다. 부분 집합을 사용하여 데이터를 제외하는 두 가지 방법이 있음을 기억하십시오.
논리 벡터를 지정하십시오. 여기서
FALSE
는 요소가 제외됨을 의미합니다.-
! (느낌표) 연산자는 논리적 부정입니다. 이것은 TRUE를 FALSE로 변환 함을 의미합니다. 따라서 홍채에서 복제본을 제거하려면 다음을 수행하십시오.
>> index iris [-index,] -
두 경우 모두 명령에 따라 행 143이 제거되었음을 알 수 있습니다.