mahout实现协同过滤
协同过滤
协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
Mahout
Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。
Mahout安装
1 | $ git clone https://github.com/apache/mahout.git mahout |
git clone速度慢怎么办?
配置ss代理,假设已有ss代理服务,则在本地安装shadowsocks客户端,开启ss代理。以下为终端shadowsocks客户端安装开启教程:
1 | $ yum install python-pip |
1 | $ pip install shadowsocks |
