eaglet

本博专注于基于微软技术的搜索相关技术
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
上一页 1 ··· 15 16 17 18 19

2007年8月14日

摘要: 在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。 本文综合作者的实际工作经验和数据挖掘理论,结合中文字符串特性介绍一套相对完整的方法,以解决上述问题.。 阅读全文

posted @ 2007-08-14 09:59 eaglet 阅读(6222) 评论(4) 推荐(0) 编辑

2007年8月12日

摘要: MS SQLSERVER 只能得到存储过程的创建语句,方法如下: sp_helptext procedureName 但是往往我们需要得到表的创建语句,比如说在数据库升级的时候判断某个表是否已经改变,或者已经有一个表存在,但不知道它的创建语句是什么,字段有没有约束,有没有主键,创建了哪些索引等等.下面我给出一个存储过程,供读者参考. 该存储过程可以得到你想得到的所有的表的创建语句,包括和表有关的索引的创建语句. 阅读全文

posted @ 2007-08-12 08:15 eaglet 阅读(1927) 评论(2) 推荐(0) 编辑

摘要: 在数据库应用的设计中,我们往往会需要获取某些表的记录总数,用于判断表的记录总数是否过大,是否需要备份数据等。我们通常的做法是:select count(*) as c from tableA 。然而对于记录数巨大的表,上述做法将会非常耗时。在DELL 4400 服务器上做试验,MS Sqlserver 2000 数据库对于100万记录的简单数据表执行上述语句,时间在1分钟以上。如果在表的某个字段上做聚簇索引,第一次执行该语句的时间和没有索引的时间差不多,之后执行上述语句,速度很快,在1秒中以内,但当表的记录数发生较大变化后,再执行该语句又会经历一次耗时的过程。而且不是每个表都适合做聚簇索引的,对于数量巨大的表,如果需要经常增删操作,建聚簇索引是一个很不明智的做法,将会极大的影响增删的速度。那么有没有一个比较简单的方法快速获取表的记录总数呢?答案是有的。 阅读全文

posted @ 2007-08-12 08:09 eaglet 阅读(1709) 评论(5) 推荐(0) 编辑

2007年8月11日

摘要: 安全证书登录组件SecUser,后简称SecUser是www.kaitoo.com开发的一款基于.Net的开放源码的安全证书登录组件,该组件可以帮助用户构建一个类似于银行的网上银行系统的基于证书验证的Web应用系统。该组件封装了证书的管理功能,验证功能,以及登录后Web应用系统的安全认证功能,为开发者提供一个方便易用且高度可扩展的安全证书系统支撑平台。 阅读全文

posted @ 2007-08-11 15:29 eaglet 阅读(5078) 评论(28) 推荐(0) 编辑

2007年7月26日

摘要: 最近在项目中使用CodeSmith + netTiers 生成数据访问层DAL,感觉效果很好,减少了大量的简单重复劳动。 不过在使用过程中发现CodeSmith提供的方法不能完全满足项目需要,主要体现在两个方面: 1、 Data.DataRepository.TableProvider.GetPaged方法无法输入带参数的条件,调用前必须进行SQL 拼 接,这样可能导致SQL 注入攻击。 2、 DataRepository.Provider.ExecuteDataSet 无法分页查询 为解决以上问题,我做了如下代码对生成的DAL进行了补充。这些代码可以在DAL外部使用,也可以修改netTiers 模板,内置到DAL中。 阅读全文

posted @ 2007-07-26 16:18 eaglet 阅读(4692) 评论(12) 推荐(0) 编辑

2007年7月11日

摘要: 在互联网上找了很久,始终没有找到完全通过程序创建自定义的证书的方法。后来想了一个折中办法,就是用程序调用 makecert.exe 先生成一个证书,证书的一些参数如Subject,有效期,序列号等可以通过参数传入,然后把生成的证书文件读到Rawdata中。通过上述方法得到的X509证书,只能获取其公钥信息,由于公钥私钥是成对出现的,如果我们要在程序中使用该证书来加解密,就必须要获取公钥对应的那个私钥。一样是在互联网上没有找到很好的解决办法,只能自己研究。目前总结出两种方法,给大家分享: 阅读全文

posted @ 2007-07-11 20:41 eaglet 阅读(11880) 评论(16) 推荐(2) 编辑

2007年7月9日

摘要: 一款轻量级的Web通讯组件,调用者只需调用一个函数就可以将桌面应用程序中需要通讯的对象发送到Web应用程序中,并可以从Web应用程序获得其响应的对象,如果调用者需要发送加密消息,该组件提供了发送加密消息的方法,同样是非常简单。 阅读全文

posted @ 2007-07-09 11:42 eaglet 阅读(4022) 评论(14) 推荐(2) 编辑

2007年6月2日

摘要: 经过一周的工作,完成了KTDictSeg 1.2 版本的开发,该版本多词库进行的初步整理,并增加了如下功能 1、 增加中文人名判断 2、 增加了正向匹配分词和反向匹配分词的选项 3、 增加了停用词过滤 4、 增加了词性标注 阅读全文

posted @ 2007-06-02 17:54 eaglet 阅读(8381) 评论(60) 推荐(0) 编辑

2007年5月24日

摘要: 这段时间通过研究目前在互联网上可以搜索到的中文分词算法,感觉很难找到既快又准的分词方法,通过几天时间的研究,我终于找到了一种快速且较准确的中文分词方法。现在回过头来想想,觉得其实问题并不很复杂,对于一般应用,我觉得这个算法应该基本够用了,当然目前没有一种方法可以达到100%的分词准确度,这个算法也是一样。对于实际应用往往需要在效率和准确度上做个折中,当然对技术的追求是无止境的,我也将继续努力,争取在后续版本中进一步提高准确度,并维持现有效率。 阅读全文

posted @ 2007-05-24 18:14 eaglet 阅读(33062) 评论(86) 推荐(3) 编辑

上一页 1 ··· 15 16 17 18 19