• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

尼古拉斯豆

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

随笔分类 -  Mahout

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中
数据挖掘和机器学习
摘要:讲解数据挖掘和机器学习的关系,以及发展过程。对了解数据挖掘和机器学习很有帮助http://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/cccf07.pdf 阅读全文

posted @ 2012-05-30 10:41 尼古拉斯豆 阅读(272) 评论(0) 推荐(0)

Apache Mahout中的机器学习算法集
摘要:Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。在Mahout实现的机器学习算法见下表:算法类算法名中文名分类算法Logistic Regression逻辑回归Bayesian贝叶斯SVM支持向量机Perceptron感知器算法Neural Network神经网络Random Forests随机森林Restrict 阅读全文

posted @ 2012-05-28 14:43 尼古拉斯豆 阅读(326) 评论(0) 推荐(0)

Mahout in action 中文翻译
摘要:【译】mahout in action 2.2 运行首个推荐引擎博客分类:Mahout in actionApache算法生活IDEMahout包含一个推荐引擎的几种类型,事实上包含传统的基于用户(user-based),基于项目(item-based)推荐算法,也包括基于“slope-one”技术的实现(这一个新的有效的方法)。你将根据实验,基于单机版的(SVD)初步实现。在下面的章节里,我们将会在Mahout的背景下和一些现实生活中的例子,来回顾上面的观察结果。我们将会考虑如何代表数据,如何进行有效的推荐算法,如何评估推荐器的效果,如何为一个特殊的问题调研和定制推荐器,最后考虑如何分布计算 阅读全文

posted @ 2012-05-28 14:24 尼古拉斯豆 阅读(666) 评论(0) 推荐(0)

mahout:推荐系统入门学习(二)
摘要:转自:http://blog.chinaunix.net/uid-26711636-id-3086382.html1)评价推荐系统优劣的方法 mahout中提供了为用户推荐物品的工具,但如何评价推荐的item是否和实际情况相符合。在机器学习和AI领域,习惯的是利用一部分数据作为训练集数据,而留出一部分实际用户喜好的数据作为测试集数据,通过估计出的值与实际测试值之间的均差、均方根等方法下的大小来评判,通常是值越小说明推荐的情况和实际值越接近,若其值为0说明完全吻合。 由于评判通过推荐系统得出的估计值和实际值之间的得分(通过均差、均方根等得到)直接关系到推荐系统的优劣,所以这里就有必要对此作出必要 阅读全文

posted @ 2012-05-28 14:17 尼古拉斯豆 阅读(689) 评论(0) 推荐(0)

mahout:推荐系统入门学习(一)
摘要:转自:http://blog.chinaunix.net/uid-26711636-id-3085923.html最近因为公司项目的需要,进入了mahout的相关学习,在hadoop论坛找到了一份入门级别的学习资料,在各大论坛mahout板块的介绍还是相当少,闲话不多说,直接切入正题。 Mahout是一个基于Hadoop实现各种机器学习与数据挖掘的算法库,它由Lucene的几个代码贡献者发起成立,整个项目是从Taste这个项目发展起来的,目前Mahout已经发布0.6.0最新版本,实现了分布式协同过滤、聚类、分类等算法,已经和Hadoop整合到了一起,成为强大的分布式数据挖掘的工具。 要想实. 阅读全文

posted @ 2012-05-28 14:15 尼古拉斯豆 阅读(809) 评论(0) 推荐(0)

Mahout基于内存的DataMode 推荐引擎Demo2
摘要:转自:http://woshiwzy.iteye.com/blog/899211//注释的部分是基于文件也可以理解为基于日志文件的,//DataModel 可以有很多种,实现abstractDataMode的子类,原则上都可以作为数据源,个人觉得,不管是那种DataMode各自有优缺点//应该视情况而定,package com.test.mahout;import java.util.List;import org.apache.mahout.cf.taste.impl.common.FastByIDMap;import org.apache.mahout.cf.taste.impl.mode 阅读全文

posted @ 2012-05-28 14:12 尼古拉斯豆 阅读(282) 评论(0) 推荐(0)

利用mahout实现推荐引擎demo1
摘要:转自:http://woshiwzy.iteye.com/blog/898115==========================================================学习这些高端的东西,有时候真的连怎么运行都不知道,只有代码。做这个实验只要在eclipse里创建一个java工程,然后写一个java文件,在src下创建一个mahout_data.txt数据文件(代码中指定路径)。然后导入mahout版本.tar.gz解压出来的目录里的jar包就可以运行了。如果运行时选择run as->java application,则会在本地目录中生成结果文件,如果run 阅读全文

posted @ 2012-05-28 14:11 尼古拉斯豆 阅读(292) 评论(0) 推荐(0)

mahout的安装及实验
摘要:Apache Mahout 简介http://www.ibm.com/developerworks/cn/java/j-mahout/一.安装mahout需要的软件:1,jdk 1.6或以上 ,下载地址不提供了。2,maven 软件项目管理工具。下载地址:http://maven.apache.org/download.html 最新版本apache-maven-3.0.4-bin.tar.gz 3,hadoop mahout进行计算是调用的hadoop,类似hive。hadoop的版本要高,0.20会出问题,具体要多高不知道。用1.0以上的就可以。4,mahouthttp://... 阅读全文

posted @ 2012-05-18 11:16 尼古拉斯豆 阅读(2593) 评论(0) 推荐(0)

 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3