비디오: How to Pronounce r as in 'red', /ɹ/ - Part 1 English 2024
결합 된 문자와 단어의 모음을 문자열이라고합니다. 텍스트로 작업 할 때마다 단어를 연결하고 (문자열을 함께 묶어서) 분리 할 수 있어야합니다. R에서는 paste () 함수를 사용하여 연결하고 strsplit () 함수를 사용하여 분할합니다. 이 섹션에서는 두 기능을 모두 사용하는 방법을 보여줍니다.
먼저, pangram이라는 문자 벡터를 만들고 "빠른 갈색 여우가 게으른 개로 점프"라는 값을 다음과 같이 지정합니다.
이 텍스트를단어 경계 (공백)로 나눌 경우 다음과 같이 사용할 수 있습니다. <1> pangram pangram [1] "느린 갈색 여우가 게으른 개로 점프"
다음과 같이 strsplit ()를 호출합니다. >> strsplit (pangram, "") [[1]] [1] "" ""여우 ""여우 "" "" "" " dog "
strsplit ()의 출력의 비정상적인 첫 번째 행은 [[1]]로 구성됩니다. R이 벡터를 표시하는 것과 비슷하게 [1]은 R이 목록의 첫 번째 요소를 나타내고 있음을 의미합니다. 목록은 R에서 매우 중요한 개념입니다. 그들은 모든 종류의 변수를 결합 할 수 있습니다.
앞의 예에서이 목록에는 하나의 요소 만 있습니다. 네, 맞습니다. 목록에는 하나의 요소가 있지만 그 요소는 벡터입니다.
목록에서 요소를 추출하려면 이중 대괄호를 사용해야합니다. pangram을 단어로 분할하고 다음과 같이 두 번째 대괄호 ([]]) 부분 집합을 사용하여 words라는 새 변수에 첫 번째 요소를 할당합니다.
words words [1] "" ""quick "" "" "" "" "" "" "" "" "" "" ""벡터의 고유 요소를 찾기 위해 텍스트의 벡터를 포함하여 unique () 함수를 사용합니다. 변수 단어에서 "the"는 두 번 나타납니다. 한 번은 소문자로, 한 번은 첫 문자를 대문자로 나타냅니다. 고유 단어 목록을 얻으려면 먼저 단어를 소문자로 변환 한 다음 unique: