비디오: r/EntitledParents | "YOU LIVE IN A $1,000,000 MANSION BUT YOU CAN'T AFFORD WI-FI!?" 2024
R에서 텍스트를 사용하여 작업 할 때 텍스트 내부에서 단어 나 패턴을 찾아야 할 수 있습니다. 미국에있는 주 목록이 있다고 가정하고 두 주로 구성된 주 이름을 찾고 싶습니다.
하위 문자열을 찾으려면 grep () 함수를 사용할 수 있습니다.이 함수는 두 가지 필수 인수를 사용합니다.
-
pattern : 찾을 패턴입니다.
-
x : 검색 할 문자 벡터입니다.
그러면 한 단어 이상으로 된 모든 주 이름을 어떻게 찾을 수 있습니까? >> 상태를 포함하는 모든 상태를 찾아 질문을 구성 할 수 있다는 것을 알게되면 쉽게 알 수 있습니다. 뉴 햄프셔 ""뉴저지 "[3]"뉴 멕시코 ""뉴욕 "[5]"노스 캐롤라이나 ""노스 다코타 "[7]"로드 (로드 아일랜드) 섬 ","사우스 캐롤라이나 "[9]"사우스 다코타 ""웨스트 버지니아 "
결과에는 뉴저지, 뉴욕, 노스 캐롤라이나, 사우스 다코타, 웨스트 버지니아와 같이 2 단어로 된 이름이있는 모든 주를 포함합니다.
East를 포함하는 상태 이름이 없음을 알 수 있습니다. 다른 찾기: >> 상태를 사용하여이를 확인할 수 있습니다. 문자 연산의 결과가 빈 벡터 인 경우 (즉, 아무 것도없는 경우), R은 문자를 문자 (0)로 표시합니다. name [grep ("East", state.. 마찬가지로 비어 있거나 길이가 0 인 숫자 벡터는 정수 (0) 또는 숫자 (0)로 표시됩니다.
R은 NULL과 빈 벡터를 구별합니다. NULL은 대개 무언가가 정의되지 않았 음을 의미합니다. 이것은 비어있는 것과는 조금 다릅니다. 예를 들어, 요소가없는 문자 벡터는 문자 (0)로 표시되는 문자 벡터입니다.