Hadoop下基于聚类协同过滤推荐算法优化的研究
【出 处】:
【作 者】:
田保军
;
胡培培
;
杜晓娟
;
苏依拉
【摘 要】
作为重要的个性化推荐算法之一,协同过滤推荐算法有其独特的优势,但同时存在数据稀疏性、冷启动和扩展性问题。针对数据稀疏性问题,对项目相似度进行改进,利用基于项目的协同过滤对原始评分矩阵进行填充,以此降低数据稀疏性对推荐质量的影响。针对冷启动问题,采用基于用户和项目属性分别进行聚类的方法,通过聚类模型建立新用户和新项目与现有用户和现有项目之间的联系,根据对现有用户和现有项目的推荐预测新用户和新项目的推荐。针对扩展性问题,利用云平台Hadoop的MapRe—duce框架完成相关算法的并行化,以此解决传统协同过滤推荐算法面临的严重扩展性问题。实验表明,改进后的算法较好地解决了以上问题。
相关热词搜索: 协同过滤 数据稀疏性 扩展性 聚类 HADOOP collaborative filtering data sparsity scalability clustering Hadoop