개인 재정 R 분류 예측 분석 모델에서 데이터 준비 방법 - 더미

R 분류 예측 분석 모델에서 데이터 준비 방법 - 더미

비디오: 뉴스 데이터 분석 및 딥러닝 기반 주가예측 2025

비디오: 뉴스 데이터 분석 및 딥러닝 기반 주가예측 2025
Anonim

예측 분석을 실행하려면 알고리즘을 사용하여 모델을 만드는 데 사용할 수있는 형식으로 데이터를 가져와야합니다. 그렇게하기 위해서는 데이터를 이해하고 그 구조를 파악하는 데 시간이 필요합니다. 함수를 입력하여 데이터의 구조를 찾습니다. 다음은 그 모습입니다: >> str (seed) '데이터. 프레임 ': 210 obs. 8 변수 중: $ V1: num 15. 3 14.9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ V4: 숫자 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: 숫자 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: 숫자 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: 숫자 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 1 …

구조를 보면 데이터가 하나의 전처리 단계와 하나의 편리한 단계가 필요하다는 것을 알 수 있습니다.

열 이름의 이름을 바꿉니다.
  • 이것은 꼭 필요한 것은 아니지만,이 예에서 이해하고 기억할 수있는 열 이름을 사용하는 것이 더 편리합니다. 범주 값을 갖는 속성을 요인으로 변경하십시오.

  • 라벨에는 세 가지 범주가 있습니다. 열 이름을 바꾸려면 >> colnames (seed) <-

c ("영역", "경계", "압축률", "길이", "너비" asymmetry ","length2 ","seedType ")

다음으로 범주 값이있는 특성을 요소로 변경합니다. 다음 코드는 데이터 형식을 인수로 변경합니다. 

>> seed $ seedType <- factor (seed $ seedType)

이 명령은 모델링 프로세스의 데이터 준비를 완료합니다. 다음은 데이터 준비 과정 후의 구조를 나타낸 것입니다: >> str (잡초) 데이터. 프레임 ': 210 obs. 8 변수: $ area: num 15. 3 14. 9 14. 3 13. 8 16 1 … $ 경계: 숫자 14 8 14 6 1 13 9 15 … $ compactness: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ length: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ width: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ asymmetry: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ length2: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ seedType: 3 레벨의 인자 "1", "2", "3": 1 1 1 1 1 1 1 1 1 1 …

R 분류 예측 분석 모델에서 데이터 준비 방법 - 더미

편집자의 선택

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100의 뷰 파인더 대신 모니터 사용 - 많은 최신 dSLR과 같은 인력

Nikon D3100은 라이브 뷰를 제공합니다.이 뷰는 사진을 찍을 때 모니터를 뷰 파인더로 사용합니다. 라이브 뷰를 켜는 것은 비디오 촬영 프로세스의 첫 번째 부분이기도합니다. 사실, 동영상을 촬영할 때 뷰 파인더 대신 모니터를 사용해야합니다. 라이브 뷰 사용 ...

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

을 사용 - Nikon D7000의 라이브 뷰 기능을 사용하여 인물

뷰 파인더 대신에 모니터를 사용하여 사진을 구성하십시오. 많은면에서 라이브 뷰 모드에서 사진을 찍는 것은 일반적인 뷰 파인더 촬영과 다르지 않습니다. 그러나 초점을 포함하여 몇 가지 중요한 단계는 라이브 뷰를 전환 할 때 매우 다르게 작동합니다. 기본 사항 ...

편집자의 선택

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

Photoshop CS6에서 소실점 작업 방법 - Photoshop CS6의 소실점 명령

원근감 평면이있는 이미지에서 사실적인 편집을 할 수 있습니다. 소실점을 사용하면 이미지에서 평면을 지정한 다음 다양한 기법을 사용하여 해당 평면에서 객체를 추가하거나 제거 할 수 있습니다. 편집이 필요한 이미지를 엽니 다. ...

Photoshop CC 픽셀의 측정, 계산 및 분석

Photoshop CC 픽셀의 측정, 계산 및 분석

연구원 및 과학자를 위해 설계된 < Photoshop CC의 측정 기능은 매우 강력합니다. 현미경이나 망원경으로 볼 수있는 기술적 인 이미지의 Whattvers 수를 계산할 수 있습니다. 이미지의 모든 요소의 정확한 크기를 알고 있으면 거의 모든 것을 발견 할 수 있습니다.

편집자의 선택

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티가 느리고 꾸준히 승리하는 이유 - 더미

온라인 커뮤니티는 정착되지 않았습니다. 잊을 수없는 일. 최선의 시나리오는 꾸준하고 유기적 인 성장을 달성하는 것이지만, 진실은 하룻밤 사이에 발생하지 않는다는 것입니다. 한 번에 소수의 회원 만 있기 때문에 처음에는 좌절 할 수 있으며 고용주는 커뮤니티가 빠르게 성장하고 있다고 생각하지 않을 수도 있지만 진실은 ...

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

블로그 사이트의 글꼴을 찾는 위치 - 웹상의 많은 장소에서 찾을 수있는 인형

글꼴을 사용하면 최상의 사이트를 찾기가 어려울 수 있습니다. Google Web 글꼴 외에도 다음 목록은 무료 또는 유료로 글꼴을 찾는 데 내가 가장 좋아하는 장소를 알려줍니다. 글꼴 찾기 퀘스트를 진행하면서 친숙해질 필요가 있습니다.

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

일부 온라인 커뮤니티 회원이 다른 사람보다 오래 머무는 이유 - 인형

온라인 커뮤니티가 일시적인 회원을 호스트한다는 것을 이해합니다. 그들은 장기간의 참가자들이지만, 대부분의 회원들은 여러 가지 이유로 잠시 후에 떠납니다. 종종 출발점은 커뮤니티 자체와는 아무런 관련이 없으며 다음 단계로 넘어갈 시간입니다.