차례:
- 의 위치로 검색 텍스트 요소 내부의 하위 텍스트의 정확한 위치를 알고있는 경우 substr () 함수를 사용하여 값을 반환합니다. 세 번째 위치에서 시작하고 상태의 여섯 번째 위치에서 멈추는 하위 텍스트를 추출합니다. >> head (substr (state. name, start = 3, stop = 6)) [1] "abam" "aska" "izon" "kans" "lifo" "lora" > R
- pattern
비디오: r/youngpeopleyoutube Best Posts #8 2024
텍스트로 작업 할 때 종종 텍스트 내에서 단어 나 패턴을 찾을 수 있다면 문제를 해결할 수 있습니다. R을 사용하면이 작업을 쉽게 수행 할 수 있습니다. 미국에있는 주 목록이 있다고 가정하고이 주 중 어느 주에 라는 단어가 포함되어 있는지 알아야합니다.
이 문제를 조사하기 위해 내장 된 데이터 세트 상태를 사용할 수 있습니다. 당신이 추측 한 - 미국의 이름을 포함하는 이름:
일반적으로 하위 문자열을 찾을 수 있습니다.By position:
-
예를 들어, R에 위치 5에서 시작하는 세 문자를 얻으라고 말할 수 있습니다. 패턴 별:
-
예를 들어, R에 하위 문자열 특정 단어 나 패턴과 일치하는 단어 패턴은 와일드 카드와 비슷합니다. 일부 카드 게임에서는 조커 카드를 사용하여 다른 카드를 나타낼 수 있습니다. 유사하게, R의 패턴은 특별한 의미를 지닌 단어 나 특정 기호를 포함 할 수 있습니다.
R
의 위치로 검색 텍스트 요소 내부의 하위 텍스트의 정확한 위치를 알고있는 경우 substr () 함수를 사용하여 값을 반환합니다. 세 번째 위치에서 시작하고 상태의 여섯 번째 위치에서 멈추는 하위 텍스트를 추출합니다. >> head (substr (state. name, start = 3, stop = 6)) [1] "abam" "aska" "izon" "kans" "lifo" "lora" > R
하위 문자열을 찾으려면 grep () 함수를 사용할 수 있습니다.이 함수는 두 가지 필수 인수를 취합니다.
pattern
:찾을 패턴입니다.
-
x : 검색 할 문자 벡터입니다.
-
New 패턴을 포함하는 모든 상태를 찾고 싶다고 가정 해보십시오. >> grep ("New", state. 이름) [1] 29 30 31 32 grep ()의 결과는 숫자 벡터로, 각 요소의 위치는 일치하는 패턴. 즉, 29 번째 주 요소입니다. name에 New라는 단어가 포함되어 있습니다. >> 상태. 이름 [29] 뉴햄프셔
휴, 그 일했다! 그러나 각 일치하는 텍스트의 위치를 입력하는 것은 많은 작업이 될 것입니다. 다행히 grep ()의 결과를 직접 사용하여 원본 벡터를 >> 상태로 설정할 수 있습니다. New New York ""New York ""New York ""New York "
grep () 함수는 대소 문자를 구별합니다. 검색 패턴과 동일한 대소 문자 (대문자 또는 소문자)의 텍스트 "new"패턴을 소문자로 검색하면 검색 결과는 비어 있습니다: >> 상태. 이름 [grep ("new", 상태.이름)] 문자 (0)