비디오: 미국의 유전자 데이터 플랫폼, 네뷸라 제노믹스(Nebula Genomics)입니다. 2024
예측 분석을위한 Amazon의 추천 시스템 중 하나는 항목 기반 협업 필터링 - 사용자가 웹 사이트에서 하나의 항목을 볼 때 회사 데이터베이스의 제품 목록을 거두어들입니다. 프로필을 만들지 않았더라도 첫 번째 항목보기에서 권장 사항을 표시하면 항목 기반 협업 필터링 시스템 (또는 콘텐츠 기반 시스템)을보고있는 것입니다.
마술처럼 보이지만 그렇지 않습니다. 귀하의 프로필은 아직 생성되지 않았지만 (로그인하지 않았거나 해당 사이트에서 이전 브라우저 기록이 없기 때문에) 시스템은 추측에 걸리는 양을 취합니다. 즉, 항목에 대한 추천을 기반으로합니다 다른 고객이 상품을 구입하거나 (또는 구매하기 전에) 본 및 따라서 최근 방문한 상품을 구매하신 분들은 다음 상품도 구매하고 있습니다.
-
이 상품을 본 후 다른 항목은 무엇을 구입합니까? 본질적으로, 권고는 현재 시청중인 항목이 사용자 커뮤니티의 행동을 기반으로 다른 항목과 얼마나 유사한지를 기반으로합니다.
-
다음은 고객의 샘플 매트릭스와 구매 한 항목을 보여줍니다. 이는 항목 기반 협업 필터링의 예로 사용됩니다.
-
-
항목 1
항목 2
항목 3항목 4 | 항목 5 <699> 항목 999 | X X 999 X 999 X 999 X 999 X 999 X 999 E 999 X 999 X 999 X 999 X 999 X 999 > I | X |
|
이제 코사인 유사성 공식을 사용하여 계산 된 항목 유사도를 살펴 보겠습니다. | 코사인 유사성 |
---|---|---|---|---|---|---|
의 수식은 (A & middot; B) / (| A || || B ||)입니다. 여기서 A와 B는 비교할 항목입니다. 다음 예제를 읽고 항목 쌍이 얼마나 유사한 지 알아 보려면 두 항목이 교차하는 셀을 찾으십시오. 숫자는 0과 1 사이입니다. 값이 1이면 항목이 완전히 유사 함을 의미합니다. 0은 유사하지 않음을 의미합니다. | 아이템 1 | 아이템 2 | ||||
아이템 3 | 아이템 4 | 아이템 5 | ||||
아이템 6 | 특정 유사성 값을 사용하거나 999 개의 항목 수를 추천 할 수 있습니다.이 시나리오에서는 0보다 크거나 같은 값인 40은 비슷하다고 말할 수 있습니다. 시스템에서 해당 품목을 권장합니다. | 예를 들어, 항목 1과 항목 2 사이의 유사성은 0입니다. 67. 항목 2와 항목 1 사이의 유사성은 동일합니다. 따라서 그것은 왼쪽 아래에서 오른쪽으로 대각선을 가로 지르는 거울 이미지입니다. 항목 6은 값이 0이므로 다른 항목과 유사하지 않음을 볼 수도 있습니다. | ||||
항목 기반 권장 시스템의 구현은 어떻게 작동하는지 간단하게 보여줍니다. 간단히하기 위해 항목 유사성을 결정하기 위해 하나의 기준 만 사용하십시오: 사용자가 항목을 구입했는지 여부. 더 복잡한 시스템은 | 사용자가 자신의 취향을 나타내는 프로필을 사용합니다. | 사용자가 항목을 얼마나 좋아하는지 (또는 높게 평가하는지) 고려 | 사용자가 구입 한 항목의 수 잠재적 추천 항목과 유사 | |||
사용자가 단순히 항목을 보았는지 여부를 기준으로 구매가 이루어지지 않았 음을 기준으로 항목을 좋아하는지 여부에 대한 가정 만들기 | 다음 두 가지 일반적인 방법이 있습니다. 이 추천 시스템을 사용하십시오: | 전자 메일 마케팅 캠페인을 통해 오프라인으로 또는 로그인 한 상태에서 웹 사이트에있는 경우 | ||||
시스템에서 마케팅 광고를 보내거나 다음 권장 사항을 웹 사이트에서 보낼 수 있습니다: | 항목 3 고객 B | 고객 B가 품목 1과 2를 구입 했으므로 추천되었고 두 품목 모두 품목 3과 유사합니다. | 품목 4, 품목 2, 고객 C | 고객 C가 품목 3과 품목 5를 구매 했으므로 좋습니다 항목 5는 항목 4와 유사하다 (유사도 값: 0. 82). 항목 2는 항목 3과 유사합니다 (유사도 값: 0.45). | ||
고객 D | 고객 D | 고객 D가 품목 3, 4 및 5를 구매 했으므로 추천 됨. 항목 3은 품목 2와 유사합니다. | ||||
품목 1 - 고객 E | 고객 E가 품목 2 3 번 항목은 항목 1과 유사합니다. | |||||
항목 3 - 고객 F | 고객 F가 항목 1, 2, 4 및 5를 구매했기 때문에 권장됩니다. 항목 1, 2 및 5는 항목 3과 유사합니다 |
로 항목 2 고객 G가 항목 1과 3을 구매했기 때문에 추천 됨. 항목 2와 비슷합니다. 항목 2, 항목 3, 고객 H 고객 H 항목 1을 구입했습니다. 항목 1은 항목 2와 3과 유사합니다.
고객 A에게 결정되지 않은 항목 A이상적으로, 더 많은 항목과 사용자가 있어야합니다. 고객이 아직 구입하지 않은 다른 품목과 유사한 일부 품목이 있어야합니다. | 고객에게 미확인 품목 I | 이 경우 데이터는 권장 사항의 기초로 사용하기에 충분하지 않습니다. 이것은 콜드 스타트 문제의 예입니다. | 사용자가 로그인하지 않은 상태에서 페이지 뷰를 통한 온라인 |