随笔分类 -  算法

数据挖掘十大算法之决策树详解(2)
摘要:在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献【1】。本博客已经介绍过的位 阅读全文
posted @ 2017-11-10 15:18 csguo 阅读(2542) 评论(0) 推荐(0)
数据挖掘十大算法之决策树详解(1)
摘要:在2006年12月召开的 IEEE 数据挖掘国际会议上(ICDM, International Conference on Data Mining),与会的各位专家选出了当时的十大数据挖掘算法( top 10 data mining algorithms ),可以参见文献【1】。本博客已经介绍过的位 阅读全文
posted @ 2017-11-10 15:17 csguo 阅读(26101) 评论(0) 推荐(3)
线性回归浅谈(Linear Regression)
摘要:在现实生活中普遍存在着变量之间的关系,有确定的和非确定的。确定关系指的是变量之间可以使用函数关系式表示,还有一种是属于非确定的(相关),比如人的身高和体重,一样的身高体重是不一样的。 线性回归: 1: 函数模型(Model): 假设有训练数据 那么为了方便我们写成矩阵的形式 2: 损失函数(cost 阅读全文
posted @ 2017-11-09 09:18 csguo 阅读(2014) 评论(0) 推荐(0)
贝叶斯推断及其互联网应用(三):拼写检查
摘要:贝叶斯推断及其互联网应用(三):拼写检查 作者: 阮一峰 日期: 2012年10月16日 作者: 阮一峰 日期: 2012年10月16日 (这个系列的第一部分介绍了贝叶斯定理,第二部分介绍了如何过滤垃圾邮件,今天是第三部分。) 使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法。 比如 阅读全文
posted @ 2017-11-08 16:22 csguo 阅读(884) 评论(0) 推荐(0)
贝叶斯推断及其互联网应用(二):过滤垃圾邮件
摘要:有关贝叶斯原理的讲解, 请查看这里。这里讲述的是通过贝叶斯推断如何过滤垃圾邮件。贝叶斯推断及其互联网应用 (接上文)七、什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有“关键词法”和“校验码法”等。前者的过 阅读全文
posted @ 2017-11-08 16:20 csguo 阅读(5255) 评论(0) 推荐(0)
贝叶斯推断及其互联网应用(一)
摘要:一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。 那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题 如何使用贝叶斯推断过滤垃圾邮件(英文版)? 说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把 阅读全文
posted @ 2017-11-08 16:08 csguo 阅读(1389) 评论(0) 推荐(0)
[数据挖掘]朴素贝叶斯分类
摘要:写在前面的话: 我现在大四,毕业设计是做一个基于大数据的用户画像研究分析。所以开始学习数据挖掘的相关技术。这是我学习的一个新技术领域,学习难度比我以往学过的所有技术都难。虽然现在在一家公司实习,但是工作还是挺忙的,经常要加班,无论工作多忙,还是决定要写一个专栏,这个专栏就写一些数据挖掘算法、数据结构 阅读全文
posted @ 2017-11-08 15:39 csguo 阅读(19887) 评论(0) 推荐(3)
粒子群优化算法
摘要:粒子群优化算法属于群智能(swarm intelligence)优化算法。群智能分两种,一种是粒群优化,另一种是蚁群优化。 群智能概念 假设你和你的朋友正在寻宝,每个人有个探测器,这个探测器可以知道宝藏到探测器的距离。你们一群人在找,每个人都可以把信息共享出去,就跟打dota时你可以有你队友的视野, 阅读全文
posted @ 2017-09-14 16:42 csguo 阅读(3765) 评论(0) 推荐(0)