Hubble.net V0.7.2.0 版本发布
V0.7.2.0 版本进行了如下改动1、提供了通过 Hubble.net 服务分析关键字的功能,这样就不需要在客户端来分析关键字了,客户端也不需要加载分词组件和Hubble.core,节省了客户端的内存和CPU资源。当然你希望用原来的方式来做也是可以的,V0.7.2.0 版本给你多了一种选择。2、提...
HubbleDotNet简介及与Lucene.net 对比测试
HubbleDotNet经过整整1年的开发,终于可以正式使用了。 昨天我发布了第二个测试版本0.7.1.0,这个版本比第一个测试版本性能上有了一定提高。Hubble.net 目前还只是提供了一些最基本的功能,很多高级的功能,比如分组统计,消重,多表关联查询等将陆续在后续版本中开发。 系统简介 Hu...
Hubble.net 0.7.1.0 版本发布
0.7.1.0 版本1.修改了若干 bug2.优化了性能3.增加了 EnglishAnalyzer 分词器4.增加了两个存储过程 SP_TestAnalyzer SP_GetWordsPositions5. SqlClient 的 SqlCommand 类增加了一个 GetWordsPosition...
爱煮饭:怎么写网站程序符合搜索引擎(SEO)标准
近期帮一个客户选择网站程序时,发现很多程序还是不符合搜索引擎(SEO)标准,那作为一个程序员,我们怎么写程序更有利于搜索收录及排名呢,今天总结一下二年多SEO经验来讲讲怎么写符合搜索引擎(SEO)标准的程序。1 网站标题:每个文章、栏目、专题、首页,可以自定义(<title>标题)(me...
Hubble.net 0.7.0.0 版本发布
Hubble.net 0.7.0.0 版本发布 Author: eaglet Hubble.net 从开发到现在整整一年时间,今天第一个测试版本终于可以发布了,也算是对我这一年来的努力的回报吧。Hubble.net 在开发过程中得到了很多园友的关注和支持,在此表示感谢,也希望大家继续关注和支持这个...
HubbleDotNet 安装指南
HubbleDotNet Team 运行安装包 Hubble.net 项目首页 http://hubbledotnet.codeplex.com/ 下载地址在项目首页的 download tab 里面。 根据您的机器硬件类型运行下面安装程序中的一个 x86/setup.exe x64/se...
Searcharoo源码学习日志(二)
Searcharoo第二版相对第一版做了很多改动,如将之前的基于当前站点的文件索引换成了基于Internet的网络爬行器、新增了HtmlDocument对象作为中间文档对象用于暂存文档信息、增加对已访问页面的判断处理、新增使用HttpWebRequest对象去获取Internet文档内容、新增去除页...
Hadoop 的一些学习资料
infoQ.com的:分布式计算开源框架Hadoop入门实践,作者:岑文初 分布式计算开源框架Hadoop介绍Hadoop中的集群配置和使用技巧Hadoop基本流程与应用开发 ibm.com的:用 Hadoop 进行分布式并行编程 基本概念与安装部署程序实例与分析部署到分布式环境 Hadoop的0....
Hubble.net 建表语句 Create Table
语法[Directory(directory)][IndexOnly] –Optional [ForceCollectCount(count)] -Optional [DBTableName(table name)] –Optional [DBAdapter(adapter ...
数据库的反范式设计,降低消耗,提高运行效率
以前听说wp没建一个分类就创建一个分类表,记得那个博主说wp效率低在这里。 这几天给一个站点分析优化策略,突然想起来wp这件事,不由得佩服wp作者的聪明之处:通过反范式设计,降低消耗,提高效率。硬盘空间低廉,但是cpu、内存资源成本高。举例如下(无图):原始设计:1. 文章分类表。id,classN...
Hubble.net 0.4 版本开发结束
Hubble.net 0.4 版本开发结束0.4 版本完成了如下功能1. TSFQL 脚本解释器框架2. Insert, update, delete 和 select 语句。3. 对批命令的支持...
盘古分词-中文人名识别算法介绍
盘古分词-中文人名识别 作者: eaglet eaglet 曾经在KTDictSeg 中分别尝试使用规则和统计方式来识别中文(汉族)人名,但效果都不理想。在盘古分词中eaglet另辟它径,采用一种新的算法来识别中文人名,效果相比规则和统计方式要好很多。下面eaglet就来介绍这种中文人名的识别方法...
关于string的indexof方法的试验
string的index方法,在字符串的操作上还是用的比较多的,但是内部的如何实现呢,这个具体用那种算法就不太清楚了。正好碰到网上一篇关于字符串搜索文章 ,作者提供了一个检索的思路,我就偷懒学习一下,呵呵。 大致的问题原型是就是indexof的实现问题 基本思路按照子串在原串中检索,如果遇到不匹配的...
C# 字符转ASCII码,ASCII码转字符 [转一下]
-->public static int Asc(string character){if (character.Length == 1){System.Text.ASCIIEncoding asciiEncoding = new System.Text.ASCIIEncoding();int...
盘古分词--功能简介
盘古分词--功能简介作者:eaglet 两年前我开发了一个KTDictSeg 中文分词组件,这个组件推出2年来受到很多朋友的喜爱。不过由于我当初开发KTDictSeg时比较仓促,底子没有打好,而且当时对分词的理解也比较肤浅,所以KTDictSeg组件存在很多问题,我一直想重新开放一个更好的开源分词组...