비디오: r/youngpeopleyoutube Best Posts #8 2024
통계 분야에서는 다음과 같은 변수를 구별 할 수 있습니다. 다른 유형은 매우 중요합니다. 데이터 유형은 매우 자주 수행 할 수있는 분석 유형을 결정합니다. 결과적으로 R은 다음과 같이 데이터를 명시 적으로 분류하는 기능을 제공합니다.
-
명목 데이터: R을 사용하여 요인으로 나타내는이 유형의 데이터는 서로 다른 범주를 구별하지만 범주간에 묵시적인 순서는 없습니다. 명목 데이터의 예로는 색 (빨강, 초록, 파랑), 성별 (남성, 여성) 및 국적 (영국, 프랑스, 일본)이 있습니다.
-
서수 데이터는 요소들 사이에 어떤 종류의 자연 순서가 있지만 상대적인 크기 차이의 표시가 없다는 사실로 구별됩니다. 순서대로 정렬 할 수 있지만 정확한 값을 제공 할 수없는 데이터는 서수입니다. 예를 들어, 낮은 "999"중간 999 "999"는 3 개의 레벨로 주문 된 데이터를 기술한다. 시장 조사에서 5 점 척도를 사용하여 인식을 측정하는 것이 일반적입니다. 강력하게 반대 <동의하지 않음 <중립 <동의 <강하게 동의합니다. 이는 서수 데이터의 한 예이기도합니다.
R에서는 서수 데이터를 설명하기 위해 주문 된 요소 를 사용합니다.
숫자 데이터:숫자 (예: 길이, 무게 또는 개수)로 데이터를 설명 할 수있는 경우 숫자 데이터가 있습니다. 숫자 데이터에는 두 개의 하위 범주가 있습니다. 간격 조정 된 데이터: 인접한 측정 단위 사이의 간격이 동일하지만 0 점이 임의 인 경우 간격 조정 된 데이터가 있습니다. 간격 조정 된 데이터의 일상적인 예는 Google 캘린더 시스템입니다. 매년 길이는 같지만 영점은 임의적입니다. 다시 말해서 시간은 0 년에 시작되지 않았습니다. 즉, 편리한 연도를 사용하여 계산을 시작하는 것입니다. 즉, 날짜 (및 다른 모든 유형의 간격 조정 된 데이터)를 더하거나 뺄 수 있지만 의미있게 날짜를 나눌 수는 없습니다. 다른 예로 경도뿐만 아니라 출발점이 어디인지에 대해 의견 차이가있을 수있는 것이 있습니다.
-
정수 또는
-
숫자 개체를 사용하여 간격 조정 데이터를 나타낼 수 있습니다.
비율 데이터 비율:모든 종류의 수학 연산이 허용되는 데이터, 특히 곱셈 및 나눗셈 (즉, 비율 가져 오기) 기능이 허용되는 데이터입니다.물리 과학의 대부분의 데이터는 길이, 질량 및 속도와 같이 비율이 조정됩니다. R에서는
숫자 개체를 사용하여 비율 조정 데이터를 나타냅니다.
-