随笔分类 -  机器学习

摘要:因子分解机(Factorization Machine, 简称FM)是一种不错的CTR预估模型,也是我们现在在使用的广告点击率预估模型,比起著名的Logistic Regression, FM能够把握一些组合的高阶特征,因此拥有更强的表现力。 在做点击率预估时,我们的特征往往来自于用户(user)、 阅读全文
posted @ 2016-12-08 18:48 罗刹剑客 阅读(3233) 评论(0) 推荐(0)
摘要:转一套Deep Learning的文章http://blog.csdn.net/zouxy09/article/details/8775360顺便附上翻译的UFLDLhttp://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B 阅读全文
posted @ 2013-04-27 01:51 罗刹剑客 阅读(721) 评论(0) 推荐(0)
摘要:今天收拾资料,发现了以前刚接触粗糙集时写的一个综述,好久没写博客,发上来充数好了一、粗糙集模型[1]粗糙集是Pawlak于上世纪八十年代提出的一种不确定数学模型。该模型以有限集合上的等价关系为基础,定义了上下近似两个基本操作。该模型与它的其他一般化或变种形式有着较为广泛的应用。1.1Pawlak粗糙集模型Pawlak粗糙集模型是以一个有限集合与集合上的一个等价关系为基础的。所谓的二元等价关系是一种满足自反性,对称性和传递性的关系的二元关系。因为这些性质,一个二元等价关系将一个集合分割成一到多个互不相较子集,形成了集合的一个分割,记为U/R,其中的元素与他们的并被称为精确集。在这一基础上,Paw 阅读全文
posted @ 2013-04-26 00:26 罗刹剑客 阅读(3123) 评论(1) 推荐(0)
摘要:不同于之前的分类和聚类算法,优化的目的是尝试找到一个使成本函数输出最小化的值。这里主要包括两个算法:模拟退火算法和遗传算法。成本函数:接受一个经推测的题解,并返回一个数值结果,该值越大代表成本越高(题解表现越差),该值越小就表示题解越好。模拟退火算法:优化算法的目标可以看为寻找x使函数f(x)最小。... 阅读全文
posted @ 2009-09-30 21:50 罗刹剑客 阅读(661) 评论(0) 推荐(0)
摘要:数学基础:线性代数的矩阵乘法运算。 非负矩阵分解是一种特征提取的算法,它尝试从数据集中寻找新的数据行,将这些新找到的数据行加以组合,就可以重新构造出数据集。算法要求输入多个样本数据,每个样本数据都是一个m维数值向量,首先把我们的数据集用矩阵的形式写出来,每一列是一个数据,而每一行是这些数据对应维度的... 阅读全文
posted @ 2009-09-25 20:09 罗刹剑客 阅读(2712) 评论(0) 推荐(0)
摘要:一直没有时间写…..唉这个东西好像是属于数据可视化?反正就是把多维的数据降到低维空间但是仍然尽可能的保持原来数据之间的距离关系(就是在原来维度下离的远的点仍然离得远,接近的点仍然接近) 。最常见的应该就是降到2维以方便打印和屏幕输出。算法的输入是所有数据在高维情况下两两之间的距离(记i与j的距离为D... 阅读全文
posted @ 2009-09-21 00:40 罗刹剑客 阅读(1830) 评论(0) 推荐(0)
摘要:因为这两个算法比较简单,又有些相似,所以这里放在一起。K-最近邻:k-最近邻也是一种用来进行预测的算法。工作原理:接受一个用以进行数值预测的新数据项,然后将它与一组已经赋过值的数据项进行比较。算法会从中找出与待预测数据最为接近的k项,并这k项其求均值以得到最终的结果。总计来说这是一个很简单的算法,只... 阅读全文
posted @ 2009-09-14 11:40 罗刹剑客 阅读(2757) 评论(0) 推荐(0)
摘要:支持向量机……复杂的东西,书里讲得也不怎么详细,起码具体算法没有说……所以又去查了些资料……支持向量机是用来对数据进行分类的。首先从最简单的情况开始吧:如果有一条直线,我们把它看成一条数轴,上面有一些样本点,其中坐标大于某个值的点都属于一类,坐标小于某个值的点都属于一类,那么我们就可以用这个值来做分... 阅读全文
posted @ 2009-09-08 12:45 罗刹剑客 阅读(537) 评论(0) 推荐(0)
摘要:生物神经网络: 在生物的神经网络中的基本单位是神经元,神经元与神经元之间是由突触的相互联系来传递信息的,在静止息状态时,神经元的膜的内外电压保持一种稳定状态(膜内电压低于膜外电压),当神经元受到刺激后,在被刺激的部分周围,这种平衡状态会被打破,电压改变,与没有受到刺激的部分形成电流传递信息,电流的强... 阅读全文
posted @ 2009-09-07 16:25 罗刹剑客 阅读(2247) 评论(0) 推荐(0)
摘要:数学基础:树:树是一种数据结构,它是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:每个结点有零个或多个子结点;每一个子结点只有一个父结点;没有前驱的结点为根结点;除了根结点外,每个子结点可以分为m个... 阅读全文
posted @ 2009-09-06 21:27 罗刹剑客 阅读(3119) 评论(0) 推荐(0)
摘要:这几天以很快的速度翻完了,因为只是对里面的算法感兴趣,对那些web2.0的应用没什么感觉,所以很多地方都是一扫而过,现在按最后一章的顺序来对所有相关的算法作一个详细的复习….这个是第一篇……贝叶斯分类器数学基础:条件概率定义:设A, B是两个事件,且P(A)>0 称P(B∣A)=P(AB)/P(A)... 阅读全文
posted @ 2009-09-05 23:35 罗刹剑客 阅读(3850) 评论(0) 推荐(0)