星云外

1 2 3 4 5 ··· 7 下一页

2011年2月18日

Trie Tree 串集合查找

摘要: http://hxraid.javaeye.com/Trie 树,又称字典树,单词查找树。它来源于retrieval(检索)中取中间四个字符构成(读音同try)。用于存储大量的字符串以便支持快速模式匹配。主要应用在信息检索领域。Trie 有三种结构: 标准trie (standard trie)、压缩trie、后缀trie(suffix trie)。最后一种将在《字符串处理4:后缀树》中详细讲,这里只将前两种。1. 标准Trie (standard trie)标准Trie树的结构:所有含有公共前缀的字符串将挂在树中同一个结点下。实际上trie简明的存储了存在于串集合中的所有公共前缀。假如有这样 阅读全文

posted @ 2011-02-18 21:38 星云外 阅读(742) 评论(1) 推荐(0) 编辑
Suffix Trie 子串匹配结构

摘要: http://hxraid.javaeye.com/Suffix Trie:又称后缀Trie或后缀树。它与Trie树的最大不同在于,后缀Trie的字符串集合是由指定字符串的后缀子串构成的。比如、完整字符串"minimize"的后缀子串组成的集合S分别如下: s1=minimize s2=inimize s3=nimize s4=imize s5=mize s6=ize s7=ze s8=e 然后把这些子串的公共前缀作为内部结点构成一棵"minimize"的后缀树,如图所示,其中上图是Trie树的字符表示,下图是压缩表示(详细见《Trie树》)。可见Suffic Trie是一种很适合操作字符串子 阅读全文

posted @ 2011-02-18 21:37 星云外 阅读(448) 评论(0) 推荐(0) 编辑
PAT Tree 子串匹配结构

摘要: http://hxraid.javaeye.com/Patricia Tree 简称PAT tree。它是 trie 结构的一种特殊形式。是目前信息检索领域应用十分成功的索引方法,它是1992年由Connel根据《PATRICIA——Patrical Algorithm to Retrieve Information Coded in Alphanumeric》算法发展起来的。PAT tree 在字符串子串匹配上有这非常优异的表现,这使得它经常成为一种高效的全文检索算法,在自然语言处理领域也有广泛的应用。其算法中最突出的特点就是采用半无限长字串(semi-infinit 阅读全文

posted @ 2011-02-18 21:33 星云外 阅读(1063) 评论(0) 推荐(0) 编辑

2011年2月11日

数据挖掘测试数据集大全

摘要: 常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:http://www.cs.waikato.ac.nz/ml/weka/UCI收集的机器学习数据集ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/\\MLRepository.htmstatlibhttp://liama.ia.ac.cn/SCILAB/scilabindexgb.htmhttp://lib.stat.cmu.edu/样本数据库http://kdd.ics.uci.edu/h 阅读全文

posted @ 2011-02-11 17:19 星云外 阅读(2269) 评论(0) 推荐(0) 编辑
ACM+算法集--常用ACM算法

摘要: 1 图算法 2 kurXX最小生成树 3 #include 4 #include 5 #include 6 using namespace std; 7 #define M 501 8 #define LIM 20000000 9 10 struct edg{ 11 int u,v; 12 int w; 13 }all_e[M... 阅读全文

posted @ 2011-02-11 12:10 星云外 阅读(733) 评论(0) 推荐(0) 编辑

2010年12月20日

提供一个Matlab的BP神经网络的基础资料(继续)

摘要: 提供一个Matlab的BP神经网络的基础资料(继续)第四节内容:bp神经网络进行交通预测的Matlab例子及源代码,bp神经网络进行交通预测的Matlab程序的优化(主要是按设置误差要求,寻找最优网络过程)根据前面三节的学习内容,可以基本编写一个BP神经网络,来处理一些问题了。下面我给出一个bp神经网络进行交通预测的Matlab源代码,里面备有较为详细的注释,供给初学者!复制内容到剪贴板代码:%bp神经网络进行交通预测的Matlab源代码% BP 神经网络用于预测% 使用平台 - Matlab7.0%数据为1986年到2000年的交通量 ,网络为3输入,1输出% 15组数据,其中9组为正常训练 阅读全文

posted @ 2010-12-20 11:02 星云外 阅读(5197) 评论(1) 推荐(0) 编辑

2010年12月18日

解决了的一个bug

摘要: logic:notEmpty name="controlBean" property="stageList"logic:iterate id="stageList" name="controlBean" property="stageList"option value=""bean:write name="stageList" property="sname"/bean:write /option/logic:iterate/logic:notEmpty属性需要是小写的。 阅读全文

posted @ 2010-12-18 15:44 星云外 阅读(170) 评论(0) 推荐(0) 编辑

2010年12月17日

Java相对路径总结

摘要: 1.基本概念的理解绝对路径:绝对路径就是你的主页上的文件或目录在硬盘上真正的路径,(URL和物理路径)例如:C:xyzest.txt 代表了test.txt文件的绝对路径。http://www.sun.com/index.htm也代表了一个URL绝对路径。相对路径:相对与某个基准目录的路径。包含Web的相对路径(HTML中的相对目录),例如:在Servlet中,"/"代表Web应用的跟目录。和物理路径的相对表示。例如:"./" 代表当前目录,"../"代表上级目录。这种类似的表示,也是属于相对路径。另外关于URI,URL,URN等内容,请参考RFC相关文档标准。RFC 2396: Unifor 阅读全文

posted @ 2010-12-17 21:55 星云外 阅读(692) 评论(0) 推荐(0) 编辑

2010年12月12日

交叉验证(CrossValidation)方法思想简介

摘要: 以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标.常见CV的方法如下:1).Hold-Out Method将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此Hold-OutMethod下分类器的性能指标.此 阅读全文

posted @ 2010-12-12 12:59 星云外 阅读(2472) 评论(0) 推荐(0) 编辑

2010年12月11日

IPHLPAPI.DLL的作用

摘要: IPHLPAPI.DLL全称ip helper api是一个用来获取、设置网络相关参数的动态链接库文件比如设置IP地址,获取网卡是否被禁用,还有一些和ARP、路由表相关的参数,比如nmap的windows port版本就利用了这个ip helper api。其实普通的winsock程序(网络客户端、服务端)是无需使用这个DLL的,QQ和MSN估计是用来得到网卡的状态,所以需要这个DLL,SKYPE估计没有那个检测网卡状态的过程,所以不需要。IPHLPAPI肯定是要和注册表打交道的,估计是你的注册表某些和网络相关的项乱掉了,所以报IPHLPAPI出错。而上不了网应该是网络相关的注册表有问题而不是 阅读全文

posted @ 2010-12-11 20:34 星云外 阅读(3114) 评论(0) 推荐(0) 编辑
1 2 3 4 5 ··· 7 下一页