개인 재정 R- 더미의 데이터에서 샘플을 취하는 방법

R- 더미의 데이터에서 샘플을 취하는 방법

비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2025

비디오: r/Mildlyinfuriating | Gah! My candy! That's it -- this is going on Reddit. 2025
Anonim

통계학자는 종종 표본을 취하여 통계를 계산해야합니다. 샘플은 실제로 데이터의 하위 집합 이상이므로 R을 사용하면 샘플을 가져 오는 것이 쉽습니다. 그렇게하기 위해, vector를 입력으로 사용하는 sample ()을 사용합니다. 그 목록에서 얼마나 많은 샘플을 가져올 지 말해줍니다.

다이의 롤을 시뮬레이트하고 싶어하고 10 개의 결과를 얻고 싶다고합시다. 단일 주사위 굴림의 결과가 1에서 6 사이의 숫자이기 때문에 코드는 다음과 같습니다.

sample ()에 10 개의 값을 반환하도록 지시합니다. 다이의 모든 롤이 다이의 다른 모든 롤과 독립적이기 때문에 대체품으로 샘플링하고 있습니다. 즉, 목록에서 하나의 샘플을 가져 와서 목록을 원래 상태로 다시 설정합니다. 즉, 방금 그린 요소를 목록에 다시 추가합니다.

이렇게하려면 예에서와 같이 replace = TRUE 인수를 추가합니다.

sample () 함수의 반환 값은 무작위로 결정된 숫자이므로이 함수를 반복적으로 사용하면 매번 다른 결과가 나옵니다. 이것은 대부분의 경우에 올바른 동작이지만 때때로 함수를 실행할 때마다 반복 가능한 결과를 얻길 원할 수도 있습니다.

일반적으로 코드를 개발하고 테스트 할 때 또는 다른 사람이 코드를 테스트하고 사용자가 수행 한 것과 동일한 값을 얻을 수 있는지 확인하려는 경우에만 발생합니다. 이 경우 소위

시드 값을 지정하는 것이 일반적입니다.

시드 값을 제공하면 난수 시퀀스가 ​​알려진 상태로 재설정됩니다. R은 진정한 난수가 아니라 의사 난수만을 생성하기 때문입니다. 의사 랜덤 시퀀스는 모든 실제 목적을 위해 무작위로 보이지만 알고리즘에 의해 생성 된 숫자 세트입니다. 의사 랜덤 프로세스의 시작 시드를 설정하면 R은 항상 동일한 의사 랜덤 시퀀스를 반환합니다.

그러나 시드를 설정하지 않으면 R은 난수 생성기 (RNG)의 현재 상태에서 그립니다. 시작시 R은 임의의 시드를 설정하여 RNG를 초기화 할 수 있지만 RNG를 호출 할 때마다 R은 RNG 스트림의 다음 값에서 시작합니다. 당신은에 대한 도움말을 읽을 수 있습니까? 자세한 내용을 얻으려면 RNG를 사용하십시오.

R에서는 세트를 사용합니다. seed () 함수는 시드 시작 값을 지정합니다. 설정할 인수입니다. seed ()는 정수 값입니다. >> 설정. seed (1)> sample (1: 6, 10, replace = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

시드를 설정하지 않고 다른 샘플을 그릴 경우, 결과는 다음과 같습니다. >> 샘플 (1: 6, 10, replace = TRUE) [1] 2 2 3 5 3 5 6 3 5

seed ()는 실제로 RNG를 재설정하고 다시 시도합니다. 그러나 이번에는 시드를 다시 한 번 설정하십시오: >>. seed (1)> sample (1: 6, 10, replace = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

처음 사용한 것과 같은 결과를 얻습니다. 씨앗 (1).

sample ()을 사용하여 데이터 프레임 아이리스에서 샘플을 가져올 수 있습니다. 이 경우 replace = FALSE 인수를 사용할 수 있습니다. 이것은 replace 인수의 기본값이므로 >> 집합을 명시 적으로 작성할 필요는 없습니다. seed (123)> index index [1] 44 119 62 133 142> 홍채 [색인,] Sepal. Length Sepal. 너비 꽃잎. 길이 꽃잎. 폭 종 44 5. 0 3. 5 1. 6 0. 6 세트 사 119 7. 7 2. 6 6. 9 2. 3 버지니아 62 5. 9 3. 0 4. 2 1. 5 versicolor 133 6. 4 2. 8 5. 6 2. 2 버지니아 142 6. 9 3. 1 5. 1 2. 3 버지니아
R- 더미의 데이터에서 샘플을 취하는 방법

편집자의 선택

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100은 라이브 뷰를 제공합니다.이 뷰는 사진을 찍을 때 모니터를 뷰 파인더로 사용합니다. 라이브 뷰를 켜는 것은 비디오 촬영 프로세스의 첫 번째 부분이기도합니다. 사실, 동영상을 촬영할 때 뷰 파인더 대신 모니터를 사용해야합니다. 라이브 뷰 사용 ...

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

뷰 파인더 대신에 모니터를 사용하여 사진을 구성하십시오. 많은면에서 라이브 뷰 모드에서 사진을 찍는 것은 일반적인 뷰 파인더 촬영과 다르지 않습니다. 그러나 초점을 포함하여 몇 가지 중요한 단계는 라이브 뷰를 전환 할 때 매우 다르게 작동합니다. 기본 사항 ...

편집자의 선택

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

원근감 평면이있는 이미지에서 사실적인 편집을 할 수 있습니다. 소실점을 사용하면 이미지에서 평면을 지정한 다음 다양한 기법을 사용하여 해당 평면에서 객체를 추가하거나 제거 할 수 있습니다. 편집이 필요한 이미지를 엽니 다. ...

Photoshop CC 픽셀의 측정, 계산 및 분석

Photoshop CC 픽셀의 측정, 계산 및 분석

연구원 및 과학자를 위해 설계된 < Photoshop CC의 측정 기능은 매우 강력합니다. 현미경이나 망원경으로 볼 수있는 기술적 인 이미지의 Whattvers 수를 계산할 수 있습니다. 이미지의 모든 요소의 정확한 크기를 알고 있으면 거의 모든 것을 발견 할 수 있습니다.

편집자의 선택

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티는 정착되지 않았습니다. 잊을 수없는 일. 최선의 시나리오는 꾸준하고 유기적 인 성장을 달성하는 것이지만, 진실은 하룻밤 사이에 발생하지 않는다는 것입니다. 한 번에 소수의 회원 만 있기 때문에 처음에는 좌절 할 수 있으며 고용주는 커뮤니티가 빠르게 성장하고 있다고 생각하지 않을 수도 있지만 진실은 ...

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

글꼴을 사용하면 최상의 사이트를 찾기가 어려울 수 있습니다. Google Web 글꼴 외에도 다음 목록은 무료 또는 유료로 글꼴을 찾는 데 내가 가장 좋아하는 장소를 알려줍니다. 글꼴 찾기 퀘스트를 진행하면서 친숙해질 필요가 있습니다.

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

온라인 커뮤니티가 일시적인 회원을 호스트한다는 것을 이해합니다. 그들은 장기간의 참가자들이지만, 대부분의 회원들은 여러 가지 이유로 잠시 후에 떠납니다. 종종 출발점은 커뮤니티 자체와는 아무런 관련이 없으며 다음 단계로 넘어갈 시간입니다.