随笔分类 - 机器学习/数据挖掘
大数据;
web挖掘;
数据检索;
机器学习
摘要:http://contest.bigdata-research.org/
阅读全文
摘要:优化算法入门系列文章目录(更新中): 1.模拟退火算法 2.遗传算法 遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化论知...
阅读全文
摘要:http://www.geekcome.com/content-10-3761-1.htmlhttp://www.geekcome.com/content-10-3761-1.htmlhttp://blog.csdn.net/zouxy09http://blog.csdn.net/celeryche...
阅读全文
摘要:http://reg.powerlinux.csdn.net/
阅读全文
摘要:http://www.zhihu.com/question/20822481知乎用户,非文, 非理Spirit_Dongdong、Wildog、mt Practices等人赞同同意@张子权的说法, 稍微再补充一下. 看问题估计, 题主可能是在学 machine learning 的东西, 所以才会有...
阅读全文
摘要:(1)前言(2)最小二乘的推导(3)最小二乘求解线性(4)曲线拟合的应用------------------qq:1327706646-------------------------author:midu--------------------------------datetime:2014-1...
阅读全文
摘要:一、ZooKeeper 的实现1.1 ZooKeeper处理单点故障我们知道可以通过ZooKeeper对分布式系统进行Master选举,来解决分布式系统的单点故障,如图所示。图 1.1 ZooKeeper解决单点故障那么我们继续分析一下,ZooKeeper通过Master选举来帮助分布式系统解决单点...
阅读全文
摘要:content概述文字识别系统LeNet-5简化的LeNet-5系统卷积神经网络的实现问题深度神经网路已经在语音识别,图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。第二篇,讲讲经典的卷积神经网络。我不打算详细描述卷积神经网络的...
阅读全文
摘要:前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,...
阅读全文
摘要:http://www.cnblogs.com/tractorman/p/4120546.htmlhttp://blog.csdn.net/v_JULY_v/article/details/6685962字符集
阅读全文
摘要:http://www.cnblogs.com/90zeng/p/probability_theory_summary.htmlhttp://www.cnblogs.com/jianxinzhou/p/4070149.html
阅读全文
摘要:第二个故事的主角是欧拉(Euler),拉普拉斯(Lapalace),勒让德(Legendre)和高斯(Gauss),故事发生的时间是十八世纪中到十九世纪初。十七、十八世纪是科学发展的黄金年代,微积分的发展和牛顿万有引力定律的建立,直接的推动了天文学和测地学的迅猛发展。当时的大科学家们都在考虑许多天文...
阅读全文
摘要:Lucene系列介绍Lucene:分词器和索引文件目录分词器索引文件结构常用的中文分词器1、分词器分词器,对文本资源进行切分,将字符文本串按照一定的规则切分为一个个可以进行索引的最小单位(关键词),以便检索时使用。建立索引和进行检索时都要用到分词器。为了保证能正确的检索到结果,在建立索引与进行检索时...
阅读全文
摘要:概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想,一个方法能够专门写出一本书来,肯定很牛逼。后来,我发现当初的那个朴素归纳推理成立了——...
阅读全文
摘要://写个简单的先练习一下,测试通过//k-均值聚类算法C语言版 #include #include #include #include #define TRUE 1 #define FALSE 0 int N;//数据个数 int K;//集合个数 int...
阅读全文
摘要:余弦计算相似度度量相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,相似度的值越大说明个体差异越大。对于多个不同的文本或者短文本对话消息要来计算他们之间的相似度如何,一个好的做法就是将这些文本中词语,映射到向量空间,形成文本中文字和向量数据的映射关...
阅读全文
摘要:先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到。 举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝。 举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻...
阅读全文
摘要:邻近算法 KNN算法的决策过程 k-Nearest Neighbor algorithm是K最邻近结点算法(k-Nearest Neighbor algorithm)的缩写形式,是电子信息分类器算法的一种该算法的基本思路是:在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的 K 篇文...
阅读全文
摘要:对于事件A和事件B同时出现的,一种信息论的描述方法就是互信息,计算方式如下其意义:由于事件A发生与事件B发生相关联而提供的信息量。在处理分类问题提取特征的时候就可以用互信息来衡量某个特征和特定类别的相关性,如果信息量越大,那么特征和这个类别的相关性越大。反之也是成立的。以搜狗实验室的语料为例。选取金...
阅读全文

浙公网安备 33010602011771号