摘要:论文出处:http://www.cs.utexas.edu/~ml/papers/libra-sigir-wkshp-99.pdf引言这篇文章里面将会详细介绍基于多项式贝叶斯的内容推荐算法的符号以及术语,公式推导以及核心思想,学习如何从文本分类的角度来实现物品推荐。详细了解算法过程后,你应该可以利用... 阅读全文
Step by Step 改进朴素贝叶斯算法
2014-07-02 16:21 by Ehome_Shasha, 922 阅读, 0 推荐, 收藏,
摘要:引言如果你对naive bayes认识还处于初级阶段,只了解基本的原理和假设,还没有实现过产品级的代码,那么这篇文章能够帮助你一步步对原始的朴素贝叶斯算法进行改进。在这个过程中你将会看到朴素贝叶斯假设的一些不合理处以及局限性,从而了解为什么这些假设在简化你的算法的同时,使最终分类结果变得糟糕,并针对... 阅读全文
CentOS6.5桌面版安装VirtualBox提示错误/etc/init.d/vboxdrv setup
2014-07-02 16:17 by Ehome_Shasha, 374 阅读, 0 推荐, 收藏,
摘要:安装步骤1.在VirtualBox主页上面下载VirtualBox-4.3-4.3.6_91406_el6-1.x86_64.rpm2.双击安装3.安装完成后选择镜像后安装系统后将出现错误对话框并提示你运行/etc/init.d/vboxdrv setup来解决问题4.运行/etc/init.d/v... 阅读全文
伯努利分布详解(包含该分布数字特征的详细推导步骤)
2014-07-02 16:14 by Ehome_Shasha, 5493 阅读, 0 推荐, 收藏,
摘要:Bernouli Distribution(中文翻译称伯努利分布)该分布研究的是一种特殊的实验,这种实验只有两个结果要么成功要么失败,且每次实验是独立的并每次实验都有固定的成功概率p。概率公式可以表示为, x只能为0或者1,即要么成功要么失败根据数学期望的性质由于这里x只有两个取值所以该分布的数学期... 阅读全文
利用LDA进行文本聚类(hadoop, mahout)
2014-07-02 16:11 by Ehome_Shasha, 3416 阅读, 0 推荐, 收藏,
摘要:项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector... 阅读全文
浙公网安备 33010602011771号