摘要: Deep learning:二十六(Sparse coding简单理解) Sparse coding: 本节将简单介绍下sparse coding(稀疏编码),因为sparse coding也是deep learning中一个重要的分支,同样能够提取出数据集很好的特征。本文的内容是参考斯坦福de... 阅读全文
posted @ 2014-10-30 21:10 博览群书1991 阅读(374) 评论(0) 推荐(0)
摘要: 这几天在看《统计学习方法》这本书,发现 梯度下降法在 感知机 等机器学习算法中有很重要的应用,所以就特别查了些资料。 一.介绍 梯度下降法(gradient descent)是求解无约束最优化问题的一种常用方法,有实现简单的优点。梯度下降法是迭代算法,每一步需要求解目标函数的梯度向量。二.应用... 阅读全文
posted @ 2014-10-30 20:21 博览群书1991 阅读(15875) 评论(0) 推荐(0)
摘要: 一,什么是BP"BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方... 阅读全文
posted @ 2014-10-30 14:41 博览群书1991 阅读(7271) 评论(0) 推荐(1)
摘要: 1.1、摘要 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一个正式的定义。然后,介绍贝叶斯分类算法的基础——贝叶斯定理。最后,通过实例讨论贝叶斯分类中最简单的一种:朴素贝叶斯分类。1.2、分类问题综述 ... 阅读全文
posted @ 2014-10-21 09:17 博览群书1991 阅读(671) 评论(0) 推荐(0)
摘要: Apriori算法和FPTree算法都是数据挖掘中的关联规则挖掘算法,处理的都是最简单的单层单维布尔关联规则。转自http://blog.csdn.net/sealyao/article/details/6460578Apriori算法Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法... 阅读全文
posted @ 2014-10-10 20:43 博览群书1991 阅读(1298) 评论(0) 推荐(0)
摘要: 在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。支持度和置信度严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频繁项集就是所谓... 阅读全文
posted @ 2014-10-09 21:06 博览群书1991 阅读(581) 评论(0) 推荐(0)
摘要: 1 Apriori介绍Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频... 阅读全文
posted @ 2014-10-09 11:18 博览群书1991 阅读(1004) 评论(0) 推荐(0)
摘要: 支持度(Support)的公式是:Support(A->B)=P(A U B)。支持度揭示了A与B同时出现的概率。如果A与B同时出现的概率小,说明A与B的关系不大;如果A与B同时出现的非常频繁,则说明A与B总是相关的。置信度(Confidence)的公式式:Confidence(A->B)=P(A ... 阅读全文
posted @ 2014-10-09 10:22 博览群书1991 阅读(6818) 评论(0) 推荐(0)
摘要: 摘要本文介绍了关联规则的基本概念和分类方法,列举了一些关联规则挖掘算法并简要分析了典型算法,展望了关联规则挖掘的未来研究方向。关键词数据挖掘,关联规则,频集,Apriori算法,FP-树1引言关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。它在数据挖掘中是一个重要的课题,最近几年已被业界所广... 阅读全文
posted @ 2014-10-09 09:37 博览群书1991 阅读(1238) 评论(0) 推荐(0)