비디오: r/youngpeopleyoutube Best Posts #8 2024
R은 텍스트 내의 패턴을 검색 할 수있는 정규 표현식의 개념을 지원합니다. 당신은 정규식에 대해 들어 본 적이 없을지도 모르지만 당신은 아마도 광범위한 개념에 익숙 할 것입니다. * 또는?를 사용한 적이 있습니까? 한 단어의 문자를 나타 내기 위해 와일드 카드 검색 형식을 사용했습니다. 정규식은 와일드 카드와 그 이상의 아이디어를 지원합니다.
정규 표현식은 단일 고정 표현식보다 더 일반적인 검색 패턴을 만드는 세 가지 방법을 허용합니다.
-
대안: 패턴으로 표시된 패턴이나 패턴의 인스턴스를 검색 할 수 있습니다. 상징. 예를 들어 비치 | 너도밤 나무는 비치 및 너도밤 나무와 일치합니다.
영어 및 미국 영어 키보드에서 일반적으로 | 백 슬래시 ()와 같은 키에 있습니다.
-
그룹화: 괄호 ()를 사용하여 패턴을 함께 그룹화합니다. 예를 들어 비치 와 너도밤 나무를 찾으려면 be (a | e) ch를 씁니다.
-
한정 기호: * (0 회 또는 여러 번 발생) 또는 + (1 회 또는 여러 번 발생)를 추가하여 패턴의 요소를 반복해야하는지 여부를 지정합니다. 예를 들어, bach 또는 너도밤 나무 (0이 아닌 둘 중 하나를 찾으려면 b e * | a *) ch. 다음 예를 시도해보십시오. >> rwords <- c ("bach", "back", "beech", "beach", "black") 해변 > 또는 너도밤 나무
대체 일치:
grep ("beach | beech", rwords) [1] 3 4
이것은 rwords의 요소 3과 4에서 검색 문자열이 발견되었음을 의미합니다. 실제 요소를 추출하려면 대괄호로 묶은 부분 집합을 사용할 수 있습니다. >> rwords [grep ("beach | beech", rwords)] [1] "beech" "beach" 이제 그룹화 규칙을 사용하여 같은 단어들: >> rwords [grep ("be | a ch", rwords)] [1] "너도밤 나무" "해변"마지막으로 수량 한정자 수정을 사용하여 999 > R에서 정규 표현식에 대한 자세한 도움말을 보려면 도움말 페이지를 살펴보십시오. 정규식. 정규 표현식에 대해 더 많이 배울 수있는 다른 훌륭한 자료로는 Wikipedia와 퀵 스타트 가이드와 튜토리얼이 있습니다.