推荐系统的数据挖掘方法有哪些?
推荐系统可以使用基于内容的方法、协同过滤方法或结合基于内容和协同过滤方法的混合方法。
基于内容的方法 - 基于内容的方法推荐与客户先前偏好或查询的项目相同的项目。它取决于产品特性和文本项目定义。
在基于内容的方法中,它是根据相似用户对不同相同项目的效用值计算得出的。许多系统都致力于推荐包含文本数据的项目,包括网站、文章和新闻信息。它们查找项目之间的共性。对于电影,它们可以查找相同的类型、导演或演员。
对于文章,它们可以查找相同的术语。基于内容的方法植根于数据理论。它们利用关键词(定义项目)和客户档案,其中包含关于用户品味和需求的数据。此类档案可以明确获得,也可以从客户随时间的交易行为中了解。
协同过滤方法 - 在协同过滤方法中,它可以考虑用户的社交环境。它根据与用户具有相同品味或偏好的不同客户的意见来推荐项目。
推荐系统需要信息检索、统计、机器学习和数据挖掘等多种方法来查找项目和用户偏好之间的相似之处。
推荐系统的优势在于,它们支持电子商务用户的个性化,以及一对一营销的开发。亚马逊作为协同推荐系统需求的先驱,将其“为每个客户提供个性化商店”作为其营销策略的一个组成部分。
个性化可以使包括用户和公司在内的双方受益。通过获得更有效的用户模型,公司可以更好地了解用户的需求。满足这些需求可以带来更高的成功率,包括相关产品的交叉销售、追加销售、产品关联性、一对一促销、更高的购物篮价值和用户留存率。
协同推荐系统尝试预测项目对用户 u 的效用,这取决于先前由与 u 相似的其他用户评级的项目。例如,在推荐书籍时,协同推荐系统试图发现多个用户,这些用户有与 u 一致的评分历史。协同推荐系统可以基于记忆(或启发式)或基于模型。
基于记忆的方法使用启发式方法根据用户先前评级的整个项目集创建评级预测。项目-用户组合的匿名评级可以计算为相同用户对相似项目的评级的聚合。