차례:
비디오: 1-4. 영화평을 이용한 감정 분석, 영화평 데이터 크롤링 - 인공지능/머신러닝 기초 2024
콘텐츠 기반 예측 분석 추천 시스템은 유사한 항목 중 기능 (태그가 지정된 키워드)과 사용자 프로필을 통해 추천을받을 수 있습니다. 사용자가 지형지 물을 태그 한 항목을 구매할 때 원래 지형지 물과 일치하는 지형지 물을 권장합니다. 더 많은 기능이 일치할수록 사용자가 추천을 좋아할 확률이 높아집니다. 이 정도의 확률을 정밀도라고합니다.
태그 지정 항목은 너무 많은 항목이있는 Amazon과 같은 상점에 대한 척도 챌린지를 제기 할 수 있습니다. 또한 일부 속성은 주관적 일 수 있으며 태그를 붙인 사람에 따라 잘못 태그 될 수 있습니다. 확장 문제를 해결하는 한 가지 솔루션은 고객 또는 일반 대중이 항목에 태그를다는 것입니다.
태그를 관리하기 쉽고 정확하게 유지하려면 웹 사이트에서 허용되는 태그 집합을 제공 할 수 있습니다. 적절한 수의 사용자가 동의 할 때만 (즉, 항목을 설명하는 데 동일한 태그 사용) 동의 한 태그를 사용하여 항목을 설명합니다.
신뢰성:모든 고객이 사실 (특히 온라인)을 말할 수있는 것은 아니며, 사용자가 태그를 지정하지 않은 사용자는 작은 평가 내역 만 데이터를 왜곡 할 수 있습니다. 또한 일부 공급 업체는 자사 제품에 긍정적 인 등급을 부여하고 다른 제품에는 부정적인 등급을 부여 할 수 있습니다 (또는 다른 사람들에게 제공하도록 권장 할 수 있음).
-
희소도: 모든 항목이 유용한 데이터를 산출 할 정도로 등급이 매겨 지거나 등급이 매겨지는 것은 아닙니다.
불일치: -
모든 사용자가 같은 키워드 일지라도 의미는 같을 수 있지만 항목에 태그를다는 것은 아닙니다. 또한 일부 특성은 주관적 일 수 있습니다. 예를 들어, 영화의 한 시청자는 다른 시청자가보기에는 너무 짧다고 생각할 수 있습니다. 속성에는 명확한 정의가 필요합니다. 경계가 너무 적은 애트리뷰트는 평가하기 어렵다. 너무 많은 규칙을 속성에 부과하는 것은 사용자에게 너무 많은 작업을하도록 요청할 수 있으며 항목에 태그를 달지 못하게합니다.
-
제품 카탈로그의 대부분의 항목에 태그를 달면 협업 필터링에 문제가되는 콜드 스타트 문제를 해결할 수 있습니다.그러나 잠시 동안 사용자 프로필을 만들거나 얻을 때까지 시스템 권장 사항의 정밀도는 낮습니다. 다음은 고객 및 구매 품목의 샘플 매트릭스입니다. 콘텐츠 기반 필터링의 예를 보여줍니다. 항목 1
항목 1
항목 2
항목 3
항목 4 | 항목 5 | 항목 1 | 항목 5 999 X 999 X 999 X 999 999 999 X 999 X 999 X 999 X 999 X 999 > X | X | 사용자가 기능 2를 좋아하고 프로필에 기록한 경우 시스템은 기능 2가 포함 된 항목 1, 항목 2 및 항목 4를 모두 추천합니다. >이 방법은 사용자가 항목을 구입하거나 검토하지 않은 경우에도 작동합니다. 시스템은 제품 데이터베이스에서 기능 2로 태그 지정된 항목을 검색합니다. 예를 들어 Audrey Hepburn이 포함 된 영화를 찾고 사용자의 기본 설정이 해당 사용자의 프로필에 표시되는 경우 시스템에서 모든 기능을 권장합니다 이 사용자에게 Audrey Hepburn이 나오는 영화. |
---|---|---|---|---|---|
이 예는 컨텐츠 기반 필터링 기술의 한계를 빠르게 나타냅니다. 사용자는 Audrey Hepburn의 모든 영화에 대해 이미 알고 있거나 쉽게 찾을 수 있습니다., 시스템은 새로운 것이나 가치있는 것을 추천하지 않았습니다. | 지속적인 피드백으로 정밀도 향상 방법 | 시스템 권장 사항의 정확성을 향상시키는 한 가지 방법은 가능할 때마다 고객에게 피드백을 요청하는 것입니다. 고객 의견 수집은 여러 채널을 통해 다양한 방법으로 수행 할 수 있습니다. 일부 회사는 구매 후 물품이나 서비스를 평가하도록 고객에게 요청합니다. 다른 시스템은 소셜 미디어 스타일의 링크를 제공하므로 고객은 제품을 "좋아"하거나 "싫어할"수 있습니다. 사이의 지속적인 상호 작용 | |||
시스템 권장 사항의 효율성 측정 방법 | 시스템 권장 사항의 성공 여부는 | 정밀도 | |||
(완벽한 일치라고 생각하는 기준 - 일반적으로 작은 세트)와 | 를 회상합니다 (가능한 일치 세트로 생각합니다 - 보통 더 큰 세트). | Precision | 은 시스템의 권장 정확도를 측정합니다. 정확성은 주관적이고 정량화하기가 어렵 기 때문에 측정하기가 어렵습니다. 예를 들어, 사용자가 Amazon 사이트를 처음 방문 할 때 Amazon은 권장 사항이 목표에 도달했는지 여부를 확실히 알 수 있습니까? | ||
일부 권장 사항은 고객의 관심사와 관련이있을 수 있지만 고객은 여전히 구매하지 않을 수 있습니다. 권장 사항이 정확한지에 대한 가장 확실한 증거는 고객이 품목을 구입한다는 것입니다. 또는 시스템이 사용자에게 권장 사항을 평가하도록 명시 적으로 요청할 수 있습니다. | 리콜 (Recall) | 는 시스템에 발생할 수있는 가능한 권장 사항을 측정합니다. 리콜을 가능한 권장 사항의 목록으로 생각하십시오. 그러나 모두가 완벽한 권장 사항은 아닙니다. 일반적으로 정확도와 회수율에는 역의 관계가 있습니다. 즉, 리콜이 올라감에 따라 정밀도가 떨어지고 그 반대도 마찬가지입니다.이상적인 시스템은 높은 정밀도와 높은 리콜을 모두 갖습니다. 그러나 현실적으로 가장 좋은 결과는 두 사람 사이의 섬세한 균형을 맞추는 것입니다. 정확도 나 회상을 강조하는 것은 실제로 해결하려는 문제에 달려 있습니다. |