개인 재정 기계 학습에서 등급 데이터의 한계

기계 학습에서 등급 데이터의 한계

비디오: 통계는 왜 윤리의 미래인가? 2024

비디오: 통계는 왜 윤리의 미래인가? 2024
Anonim

등급 데이터는 기계 학습에 한계가 있습니다.) 추천 시스템이 잘 작동하려면 고객과 마찬가지로 다른 사람에 대해서도 알아야합니다. 등급 데이터를 취득하면 추천 시스템이 여러 고객의 경험을 통해 학습 할 수 있습니다. 등급 데이터는 판단 (예: 별 또는 숫자를 사용하여 제품 등급 지정) 또는 사실 (간단히 이진 1/0

데이터 소스 또는 유형에 관계없이 평가 데이터는 항상 행동에 관한 것입니다. 영화를 평가하기 위해서는 영화를 본 경험에 따라 영화를 보거나보고 나서 영화를 평가해야합니다. 실제 추천 시스템은 평가 데이터에서 다양한 방식으로 학습합니다:

  • 협업 필터링: 일치 이전에 사용 된 영화 또는 제품 유사성을 기반으로 한 평가자. 항목을 기반으로 추천을 얻을 수 있습니다. 너와 비슷한 사람이나 좋아하는 사람이 좋아하는 것.
  • 콘텐츠 기반 필터링: 영화를 본다는 사실을 넘어서십시오. 이 기능은 사용자와 영화를 기준으로 해당 기능을 검사하여 해당 기능이 나타내는 더 큰 범주를 기반으로 일치하는 항목이 있는지 확인합니다. 예를 들어, 당신이 액션 영화를 좋아하는 여성이라면, 추천인은이 두 범주의 교차점을 포함하는 제안을 찾을 것입니다.
  • 지식 기반 권장 사항: 사용자가 표현한 선호도 및 제품 설명과 같은 메타 데이터를 기반으로합니다. 컴퓨터 학습에 의존하며 사용자 또는 제품 특성을 결정할만큼 충분한 행동 데이터가 없을 때 효과적입니다. 이를 콜드 스타트 ​​ 라고하며 협업 필터링 또는 콘텐츠 기반 필터링에 액세스 할 수 없기 때문에 가장 어려운 추천 작업 중 하나입니다.

협업 필터링을 사용할 때 유사성을 계산해야합니다. 유클리드 (Euclidean), 맨해튼 (Manhattan), 체비 셰프 (Chebyshev) 거리와 별개로 나머지 정보는 코사인 유사성을 설명합니다. 코사인 유사성 은 두 벡터 사이의 각 코사인 거리를 측정합니다.이 거리는 파악하기 어려운 개념처럼 보일 수 있지만 데이터 공간의 각도를 측정하는 방법 일뿐입니다.

두 개의 포인트를 가진 피처로 이루어진 공간을 상상해보십시오. 포인트 간의 거리를 측정 할 수 있습니다. 예를 들어, 유클리드 거리를 사용할 수 있습니다. 이는 치수가 거의없는 경우 완벽한 선택이지만 치수의 저주로 인해 여러 개의 치수가있을 때 비참하게 실패합니다.

Star Wars에 배치합니다.

printL (colnames (MovieLense [50])) [1] "스타 워즈 (1977)"

similar_movies <- 유사성 (MovieLense [50],

(1995 년) "토이 스토리 (1995)"

"코사인",

= "items")

colnames (similar_movies) [which (similar_movies> 0.70) "제국의 반격, (1980)"

[3] "잃어버린 방주의 해적 (1981)"

"제다이의 귀환 (1983)"

기계 학습에서 등급 데이터의 한계

편집자의 선택

Photoshop Elements 11 - Stone

Photoshop Elements 11 - Stone

을 사용하여 Stone Out을 조각하는 방법 Photoshop Elements 11의 도구를 입력하여 텍스트와 같은 모양의 선택 영역을 만든 다음 이미지 자체를 해당 유형의 채우기로 사용합니다. 예를 들어 꽃 테마 웹 페이지를 만드는 경우 꽃 그림을 텍스트 채우기로 사용할 수 있습니다. 유형 선택을 사용하면 모든 부분을 잘라낼 수 있습니다.

Photoshop Elements 9에서 여러 파일을 일괄 처리하는 방법 - 여러 개의 인형이있는 경우

Photoshop Elements 9에서 여러 파일을 일괄 처리하는 방법 - 여러 개의 인형이있는 경우

여러 파일에 공통적으로 적용 할 편집 기능을 사용하면 Photoshop Elements에서 이러한 변경 사항을 일괄 적으로 처리 할 수 ​​있습니다. 단일 메뉴 명령을 사용하여 파일 형식을 변경하고 파일 속성을 변경하고 공통 파일 기본 이름을 추가 할 수 있습니다. 파일 이름 바꾸기는 내보내기 명령의 일부일 수도 있고 사용할 수도 있습니다.

편집자의 선택

승마 2012 런던 하계 올림픽 - 인형

승마 2012 런던 하계 올림픽 - 인형

승마 (말의 화려한 이름) 경쟁 런던 2012 하계 올림픽은 조련사, 이벤트 및 점프의 세 가지 분야로 구성됩니다. 각 분야는 팀과 개인 메달을위한 기회를 제공합니다. 대회는 7 월 28 일부터 31 일까지 개최됩니다. 조련사 경연 대회는 8 월 2 일부터 9 일까지 개최됩니다. 점프 대회는 ...

동계 올림픽에서의 자유형 스키 - 인형

동계 올림픽에서의 자유형 스키 - 인형

프리 스타일 스키는 동계 올림픽의 X 게임 이벤트 중 하나입니다. . 자유형 스키에서는 경쟁자가 언덕 꼭대기에서 바닥까지 다양한 행사를 수행합니다. 프리 스타일 스키는 기술 스키의 가장 중요한 부분을 차지하며 스노우 보드에서 트릭을 만들어내는 기술과 결합되어 있습니다.

필드 2012 런던 하계 올림픽의 이벤트 - 인형

필드 2012 런던 하계 올림픽의 이벤트 - 인형

스프린트, 릴레이 및 도로 경주 이외에도 2012 런던 하계 올림픽 육상 경기에는 점프 및 던지기 경기가 포함됩니다. 남자와 여자는 높은 점프, 긴 점프, 트리플 점프, 장대 높이뛰기 등의 4 가지 점프 이벤트와 총구, 원반, 창 던지기 및 망치와 같은 네 가지 투구 이벤트에서 경쟁합니다. 필드 이벤트 ...

편집자의 선택

Excel의 유용한 범위 객체 메소드 2016 VBA 프로그래밍 - VBA 메소드가 수행하는

Excel의 유용한 범위 객체 메소드 2016 VBA 프로그래밍 - VBA 메소드가 수행하는

엑셀 2016의 액션. Range 객체는 수십 개의 메소드를 가지고 있지만, 이들 중 대부분은 필요하지 않습니다. 여기서는 가장 일반적으로 사용되는 Range 객체 메소드를 찾습니다. Select 메서드 Select 메서드를 사용하여 셀 범위를 선택합니다. 다음 문은 ...

시나리오 관리자를 사용하여 대출 계산 모델링 방법 - 더미

시나리오 관리자를 사용하여 대출 계산 모델링 방법 - 더미

시나리오 관리자는 목표 탐색 데이터 탭의 가정 분석 섹션에 데이터 테이블이 있습니다. 다른 유용한 도구와 함께 그룹화하면 시나리오 관리자가 중요한 도구임을 믿게 될 것입니다. 그러나 유용한 이름과 좋은 회사가 있음에도 불구하고 ...

더 나은보고 모델을 위해 Power Query와 Power Pivot을 함께 사용 - Power Pivot을 사용하여 더미

더 나은보고 모델을 위해 Power Query와 Power Pivot을 함께 사용 - Power Pivot을 사용하여 더미

Power Query를 함께 사용하면 관리 및 유지 보수가 쉬운보고 모델을 만들 수 있습니다. 보고 모델은보고 메커니즘이 구축되는 기초를 제공합니다. 데이터를 가져오고, 변환하고, 모양을 만들고, 집계하는보고 프로세스를 작성하면 본질적으로보고 모델을 구축하게됩니다. 잘못 작성하는 중 ...