개인 재정 예측 분석을 위해 R 회귀 분석에서 데이터 준비 방법 - 인형

예측 분석을 위해 R 회귀 분석에서 데이터 준비 방법 - 인형

비디오: 베이지안 사후 확율 분포(posterior probability distribution) 분석은 '백선생 김치 볶음밥 간맞추기'이다 | 최프란의 비유 - 측정 통계 데이터 분석 2024

비디오: 베이지안 사후 확율 분포(posterior probability distribution) 분석은 '백선생 김치 볶음밥 간맞추기'이다 | 최프란의 비유 - 측정 통계 데이터 분석 2024
Anonim

알고리즘이 예측 분석 모델을 작성하는 데 사용할 수있는 양식으로 데이터를 가져와야합니다. 그렇게하려면 데이터를 이해하고 데이터 구조를 파악하는 데 시간이 필요합니다. 함수를 입력하여 데이터의 구조를 찾습니다. 명령과 출력은 >> str (autos) '데이터와 같습니다. 프레임 ': 398 obs. 9 개의 변수 중 $ V1: 숫자 18 15 18 16 17 15 14 14 14 15 … $ V2: int 8 8 8 8 8 8 8 8 8 8 … $ V3: num 307 350 318 304 302 429 454 440 455 390 … $ V4: chr "130. 0" "165. 0" "150. 0" "150. 0"… $ V5: num 3504 3693 3436 3433 3449 … $ V6: num 12 11. 5 11 12 10. 10 10 9 8. 5 10 8. 5 … $ V7: int 70 70 70 70 70 70 70 70 70 70 … $ V8: int 1 1 1 1 1 1 1 1 1 1 … $ V9: 305 레벨의 요소 "amc ambassador brougham", …:

50 37 232 15 162 142 55 224 242 2 … 

구조를 보면 데이터 준비 및 정리 작업이 있음을 알 수 있습니다. 필요한 작업 목록은 다음과 같습니다.

열 이름의 이름을 바꿉니다.
  • 이것은 꼭 필요한 것은 아니지만이 예제의 목적 상 이해하고 기억할 수있는 열 이름을 사용하는 것이 좋습니다.

    V4 (

  • 마력 )의 데이터 유형을 숫자 데이터 유형으로 변경하십시오. 이 예에서 마력은 문자 데이터 유형이 아닌 연속적인 숫자 값입니다.

    누락 된 값을 처리합니다.

  • 여기 마력은 6 개의 빠진 값이 있습니다.

    불연속 값을 갖는 속성을 요인으로 변경합니다.

  • 여기서 실린더, 모델 연도 및 원점은 개별 값을가집니다.

    V9 (

  • 자동차 이름 ) 특성을 삭제합니다. 여기서 자동차 이름은 생성하려는 모델에 가치를 추가하지 않습니다. 원점 속성을 지정하지 않으면 자동차 이름 속성에서 원점을 파생시킬 수 있습니다.

    colnames (autos) <-

c ("mpg", "cylinders", "displacement", "horsepower"

autos $ horsepower <- "weight", "acceleration", "modelYear", "origin", 

"carName")

다음으로 마력의 데이터 유형을 숫자로 변경합니다. 같이. 숫자 (자동차 $ 마력)

마력의 모든 값이 숫자의 문자열 표현이 아니기 때문에 프로그램에서 불평 할 것입니다. "?"로 표현 된 누락 된 값이있었습니다. " 캐릭터. R은 각 인스턴스를 변환하기 때문에 지금은 괜찮습니까? NA로

연속 변수의 누락 된 값을 처리하는 일반적인 방법은 누락 된 각 값을 전체 열의 평균으로 바꾸는 것입니다. 다음 코드는 그 일을합니다: >> autos $ horsepower [is.na (autos $ horsepower)] <- 평균 (autos $ 마력, na. rm = TRUE)

na를 갖는 것이 중요합니다. 평균 함수에서 rm-TRUE. 이 함수는 계산시 Null 값을 가진 열을 사용하지 않도록 함수에 지시합니다. 그것이 없으면 함수가 반환됩니다.

다음으로 불연속 값을 갖는 속성을 인자로 변경합니다. 세 가지 속성이 분리되어 식별되었습니다. 다음 세 줄의 코드는 속성을 변경합니다. >> autos $ originars $ modelYear autos $ cylinders <- factor (autos $ cylinders)

마지막으로이 코드 줄을 사용하여 데이터 프레임에서 속성을 제거합니다. >> autos $ carName <- nULL < 이 시점에서 모델링 프로세스의 데이터를 준비했습니다. 다음은 데이터 준비 프로세스 후의 구조를 나타낸 것입니다: >> str (autos) '데이터. 프레임 ': 398 obs. 8 개의 변수 중: $ mpg: num 18 15 18 16 17 15 14 14 14 15 … $ cylinders: Factor w / 5 레벨 "3", "4", "5", "6", …:

5 5 5 5 5 5 5 5 5 5 … $ displacement: num 307 350 318 304 302 429 454 440 455 390 … $ 마력: num 130 165 150 150 140 198 220 215 225 190 … $ 중량: num 3504 3693 3436 3433 3449 … $ 가속도: num 12 11. 5 11 12 10. 5 10 9 8. 5 10 8. 5 … $ modelYear: 13 레벨 "70", "71", "72", …:

1 1 1 1 1 1 1 1 1 1 1 … $ 원점: 3 레벨 "1", "2", "3": 1 1 1 1 1 1 1 1 1 …

예측 분석을 위해 R 회귀 분석에서 데이터 준비 방법 - 인형

편집자의 선택

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

JavaScript에서 HTML 양식 요소에 액세스하는 방법 - 다른 HTML 요소와 마찬가지로

자바 스크립트에서 HTML5 요소와 직접 상호 작용할 수 있습니다. 트릭은 선택한 요소가 지원해야하는 브라우저 및 플랫폼에서 작동하는지 확인하는 것입니다. 이 예제에서는 및 태그를 다음과 같은 솔루션의 일부로 사용하는 방법을 보여줍니다.

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

CSS 값 정의에 대한 빠른 가이드 구문 - 인형

W3C (World Wide Web Consortium)에서 모든 CSS 속성의 구문과 가능한 값을 정의합니다. 정의를 가능한 한 정확하게 만들기 위해 W3C는 CSS 값 정의 구문이라는 공식 시스템을 사용합니다. 정의 구문은 가능한 값을 매우 정확하게 정의하지만 CSS 값 정의 구문을 읽는 중 ...

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

JavaScript로 동적 HTML 요소를 작성하는 방법 - 더미

모든 페이지에 대한 특수 효과는 페이지에 동적 HTML 변경 기능을 제공하는 것입니다. 예를 들어 다음 예제와 같이 선택한 요소에 특수 효과를 만들 수 있습니다. function ChangeStyles (event) {// 요소에 대한 참조를 얻습니다. var ThisElement ...

편집자의 선택

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 변경 내용 수락 또는 거부 방법 - 변경 내용 추적을 설정하면 더미

Excel 2013 통합 문서의 경우 리본의 검토 탭에있는 변경 내용 추적 명령 단추의 드롭 다운 메뉴에서 Alt / RGC를 눌러 변경 내용 적용 / 거부 옵션을 선택하여 수락 또는 거부 할 변경 내용을 결정할 수 있습니다. 이렇게하면 Excel이 강조 표시된 모든 변경 내용을 검토합니다 ...

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel에서 셀에 설명을 추가하는 방법 2016 - 문자

Excel 2016 워크 시트의 특정 셀에 주석을 달 수 있습니다. 댓글은 스티커 메모의 전자 팝업 버전과 유사합니다. 셀에 주석을 추가하려면 다음과 같이하십시오. 셀 포인터를 이동하거나 주석을 추가 할 셀을 클릭하십시오. 새 주석을 클릭하십시오.

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

Excel 피벗 테이블에 계산 된 필드를 추가하는 방법 - 더미

피벗 테이블 내부의 값을 계산합니다. 계산 된 필드 및 항목을 표에 추가 할 수 있습니다. 계산 된 필드를 추가하면 새로운 행이나 열을 피벗 테이블에 삽입 한 다음 수식을 사용하여 새 행이나 열을 채울 수 있습니다. 예를 들어 다음과 같이 나타납니다.

편집자의 선택

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

포토샵 CS6에서 히스토리 기능으로 채우기를 사용하는 방법 - 더미

채우기 Adobe Photoshop의 기능 Creative Suite 6는 선택을 원할 때 유용합니다. 특정 상태로 바꿀 영역을 쉽게 선택할 수 있으면 기록으로 채우기 기능을 사용할 수 있습니다. 특정 이미지에서 하늘이 마음에 들지 않는다고 가정 해보십시오. 선택한 항목 ...

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6에서 패싯 필터를 사용하는 방법 -

Photoshop CS6의 이미지는 먼지와 스크래치를 줄이거 나 날카로운 모서리를 부드럽게하는 것입니다. 패싯 필터는 포스터 라이징 효과를 사용하여 이미지를 분할합니다. Photoshop CS6에서 이미지를 흐리게 처리하려는 한 가지 이유는 먼지 및 스크래치를 줄이거 나 밝기를 비슷하게하는 픽셀 블록을 모아서 기하학적 모양을 사용하여 단일 값으로 변환하기 때문입니다.

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6에서 손 도구 사용 방법 - 인형

Photoshop CS6 손 도구는 이미지 문서에서 빠르게 이동하고 스크롤 막대와 유사하게 작업하여 작업을보다 신속하게 수행 할 수 있습니다. 손 도구는 손 도구를 클릭 할 필요가 거의 없기 때문에 실제 도구보다 기능이 더 많습니다. 간단히 ...