上一页 1 ··· 70 71 72 73 74 75 76 77 78 ··· 119 下一页

2013年11月11日

网页正文提取

摘要: 目前互联网上公布出来的正文提取算法,大家可以综合比较下,一起来测试下哪个更好用。 词网--北京词网科技有限公司http://demo.cikuu.com/cgi-bin/cgi-contex 猎兔网页正文提取 http://www.lietu.com/extract/ PHP版网页正文提取htt... 阅读全文

posted @ 2013-11-11 17:40 代码王子 阅读(371) 评论(0) 推荐(0)

最小二乘法

摘要: 最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。 利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。 最小二乘法还可用于曲线拟合。 其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 目... 阅读全文

posted @ 2013-11-11 17:40 代码王子 阅读(408) 评论(0) 推荐(0)

桶排序

摘要: 桶排序 (Bucket sort)或所谓的箱排序,是一个排序算法,工作的原理是将阵列分到有限数量的桶子里。每个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。桶排序是鸽巢排序的一种归纳结果。当要被排序的阵列内的数值是均匀分配的时候,桶排序使用线性时间(Θ(n)... 阅读全文

posted @ 2013-11-11 17:39 代码王子 阅读(231) 评论(0) 推荐(0)

HMM模型

摘要: HMM有三个典型(canonical)问题: 已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决. 已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决. 已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Wel... 阅读全文

posted @ 2013-11-11 17:39 代码王子 阅读(119) 评论(0) 推荐(0)

谱聚类

摘要: 1. 谱聚类 给你博客园上若干个博客,让你将它们分成K类,你会怎样做?想必有很多方法,本文要介绍的是其中的一种——谱聚类。 聚类的直观解释是根据样本间相似度,将它们分成不同组。谱聚类的思想是将样本看作顶点,样本间的相似度看作带权的边,从而将聚类问题转为图分割问题:找到一种... 阅读全文

posted @ 2013-11-11 17:39 代码王子 阅读(212) 评论(0) 推荐(0)

PageRank

摘要: 1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也... 阅读全文

posted @ 2013-11-11 17:39 代码王子 阅读(566) 评论(0) 推荐(0)

FPGrowth

摘要: 在挖掘关联规则的过程中,无可避免要处理海量的数据,也就是事务数据库如此之大,如果采用Apriori算法来挖掘,每次生成频繁k-项集的时候,可能都需要扫描事务数据库一遍,这是非常耗时的操作。那么,可以想尽办法来减少扫描事务数据库的次数,来改进挖掘频繁关联规则的效率。 FP-tree是频繁模式树,... 阅读全文

posted @ 2013-11-11 17:38 代码王子 阅读(968) 评论(0) 推荐(0)

Aprior算法

摘要: 在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。 支持度和置信度 严格地说Apriori和FP-Tree都是寻找频繁项集的算法,频... 阅读全文

posted @ 2013-11-11 17:38 代码王子 阅读(416) 评论(0) 推荐(0)

BP神经网络

摘要: BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。 一个... 阅读全文

posted @ 2013-11-11 17:38 代码王子 阅读(224) 评论(0) 推荐(0)

ANN实现

摘要: ANN核心数据结构: typedef struct { int input_n; /* number of input units */ int hidden_n; /* number of hidden ... 阅读全文

posted @ 2013-11-11 17:38 代码王子 阅读(370) 评论(0) 推荐(0)

上一页 1 ··· 70 71 72 73 74 75 76 77 78 ··· 119 下一页

导航