02 2015 档案

[转载]从机器学习谈起
摘要:在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。 阅读全文

posted @ 2015-02-05 22:56 Bin的专栏 阅读(1411) 评论(0) 推荐(1)

稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
摘要:稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在90%甚至99%以上。因此我们需要有高效的稀疏矩阵存储格式。本文总结几种典型的格式:COO,CSR,DIA,ELL,HYB。 阅读全文

posted @ 2015-02-04 23:05 Bin的专栏 阅读(43528) 评论(3) 推荐(10)

机器学习距离公式总结
摘要:这篇博客主要介绍机器学习和数据挖掘中一些常见的距离公式,包括: 闵可夫斯基距离 欧几里得距离 曼哈顿距离 切比雪夫距离 马氏距离 余弦相似度 皮尔逊相关系数 汉明距离 杰卡德相似系数 编辑距离 DTW 距离 KL 散度 阅读全文

posted @ 2015-02-02 23:10 Bin的专栏 阅读(5230) 评论(0) 推荐(4)

随机采样方法整理与讲解(MCMC、Gibbs Sampling等)
摘要:随机模拟也可以叫做蒙特卡罗模拟(Monte Carlo Simulation)。这个方法的发展始于20世纪40年代,和原子弹制造的曼哈顿计划密切相关。随机模拟中有一个重要的问题就是给定一个概率分布p(x),我们如何在计算机中生成它的样本。 阅读全文

posted @ 2015-02-01 21:46 Bin的专栏 阅读(96487) 评论(12) 推荐(18)

今天开始学Pattern Recognition and Machine Learning (PRML),章节5.2-5.3,Neural Networks神经网络训练(BP算法)
摘要:这一篇是整个第五章的精华了,会重点介绍一下Neural Networks的训练方法——反向传播算法(backpropagation,BP),这个算法提出到现在近30年时间都没什么变化,可谓极其经典。也是deep learning的基石之一。还是老样子,下文基本是阅读笔记(句子翻译+自己理解),把书里的内容梳理一遍,也不为什么目的,记下来以后自己可以翻阅用。 阅读全文

posted @ 2015-02-01 14:32 Bin的专栏 阅读(2012) 评论(0) 推荐(1)

导航