0

Hubble.net V0.7.2.0 版本发布

V0.7.2.0 版本进行了如下改动1、提供了通过 Hubble.net 服务分析关键字的功能,这样就不需要在客户端来分析关键字了,客户端也不需要加载分词组件和Hubble.core,节省了客户端的内存和CPU资源。当然你希望用原来的方式来做也是可以的,V0.7.2.0 版本给你多了一种选择。2、提...

eaglet 发布于 2009-12-18 20:21 评论(19) 阅读(2239)
9

HubbleDotNet简介及与Lucene.net 对比测试

HubbleDotNet经过整整1年的开发,终于可以正式使用了。 昨天我发布了第二个测试版本0.7.1.0,这个版本比第一个测试版本性能上有了一定提高。Hubble.net 目前还只是提供了一些最基本的功能,很多高级的功能,比如分组统计,消重,多表关联查询等将陆续在后续版本中开发。 系统简介 Hu...

eaglet 发布于 2009-12-15 09:44 评论(49) 阅读(8909)
1

Hubble.net 0.7.1.0 版本发布

0.7.1.0 版本1.修改了若干 bug2.优化了性能3.增加了 EnglishAnalyzer 分词器4.增加了两个存储过程 SP_TestAnalyzer SP_GetWordsPositions5. SqlClient 的 SqlCommand 类增加了一个 GetWordsPosition...

eaglet 发布于 2009-12-14 15:05 评论(7) 阅读(1390)
0

爱煮饭:怎么写网站程序符合搜索引擎(SEO)标准

近期帮一个客户选择网站程序时,发现很多程序还是不符合搜索引擎(SEO)标准,那作为一个程序员,我们怎么写程序更有利于搜索收录及排名呢,今天总结一下二年多SEO经验来讲讲怎么写符合搜索引擎(SEO)标准的程序。1 网站标题:每个文章、栏目、专题、首页,可以自定义(<title>标题)(me...

编程入门 发布于 2009-12-09 15:56 评论(2) 阅读(664)
1

Hubble.net 0.7.0.0 版本发布

Hubble.net 0.7.0.0 版本发布 Author: eaglet Hubble.net 从开发到现在整整一年时间,今天第一个测试版本终于可以发布了,也算是对我这一年来的努力的回报吧。Hubble.net 在开发过程中得到了很多园友的关注和支持,在此表示感谢,也希望大家继续关注和支持这个...

eaglet 发布于 2009-11-30 15:14 评论(18) 阅读(1174)
2

HubbleDotNet 安装指南

HubbleDotNet Team 运行安装包 Hubble.net 项目首页 http://hubbledotnet.codeplex.com/ 下载地址在项目首页的 download tab 里面。 根据您的机器硬件类型运行下面安装程序中的一个 x86/setup.exe x64/se...

eaglet 发布于 2009-11-30 14:47 评论(62) 阅读(12927)
0

Hubble.net 0.6 版本生成

该版本完成1. 查询分析器2. 批量导入数据3. 性能测试4. 索引时添加文档权重5. 优化排序性能...

eaglet 发布于 2009-10-19 15:05 评论(6) 阅读(767)
1

Searcharoo源码学习日志(二)

Searcharoo第二版相对第一版做了很多改动,如将之前的基于当前站点的文件索引换成了基于Internet的网络爬行器、新增了HtmlDocument对象作为中间文档对象用于暂存文档信息、增加对已访问页面的判断处理、新增使用HttpWebRequest对象去获取Internet文档内容、新增去除页...

Yin.P 发布于 2009-10-08 02:19 评论(0) 阅读(1855)
0

Hubble.net 0.5 版本开发完成

该版本完成了create tabledrop table 表级别锁系统存储过程优化了大量插入时的内存管理...

eaglet 发布于 2009-09-29 10:21 评论(3) 阅读(677)
0

Hadoop 的一些学习资料

infoQ.com的:分布式计算开源框架Hadoop入门实践,作者:岑文初 分布式计算开源框架Hadoop介绍Hadoop中的集群配置和使用技巧Hadoop基本流程与应用开发 ibm.com的:用 Hadoop 进行分布式并行编程 基本概念与安装部署程序实例与分析部署到分布式环境 Hadoop的0....

searchDM 发布于 2009-09-16 12:28 评论(0) 阅读(493)
0

Hubble.net 建表语句 Create Table

语法[Directory(directory)][IndexOnly] –Optional [ForceCollectCount(count)] -Optional [DBTableName(table name)] –Optional [DBAdapter(adapter ...

eaglet 发布于 2009-09-15 15:21 评论(6) 阅读(1851)
2

数据库的反范式设计,降低消耗,提高运行效率

以前听说wp没建一个分类就创建一个分类表,记得那个博主说wp效率低在这里。 这几天给一个站点分析优化策略,突然想起来wp这件事,不由得佩服wp作者的聪明之处:通过反范式设计,降低消耗,提高效率。硬盘空间低廉,但是cpu、内存资源成本高。举例如下(无图):原始设计:1. 文章分类表。id,classN...

红民 发布于 2009-09-07 10:57 评论(27) 阅读(3239)
1

Hubble.net 0.4 版本开发结束

Hubble.net 0.4 版本开发结束0.4 版本完成了如下功能1. TSFQL 脚本解释器框架2. Insert, update, delete 和 select 语句。3. 对批命令的支持...

eaglet 发布于 2009-09-01 15:54 评论(8) 阅读(1087)
2

背包分组问题的解法

背包分组问题的解法 作者:eaglet 今天在博问中看到这样一个问题 按记录总值比例分组记录 ,这个问题本质上是一个背包分组的问题。eaglet 花了2小时时间写了一个C#的实现,时间仓促,感觉还有很多值得改进的地方,不管怎么样,功能是实现了,贴出来给大家讨论吧。 我先把原题的意思按照我的理解再...

eaglet 发布于 2009-08-28 11:02 评论(15) 阅读(3449)
10

盘古分词-中文人名识别算法介绍

盘古分词-中文人名识别 作者: eaglet eaglet 曾经在KTDictSeg 中分别尝试使用规则和统计方式来识别中文(汉族)人名,但效果都不理想。在盘古分词中eaglet另辟它径,采用一种新的算法来识别中文人名,效果相比规则和统计方式要好很多。下面eaglet就来介绍这种中文人名的识别方法...

eaglet 发布于 2009-08-19 10:01 评论(29) 阅读(17521)
0

关于string的indexof方法的试验

string的index方法,在字符串的操作上还是用的比较多的,但是内部的如何实现呢,这个具体用那种算法就不太清楚了。正好碰到网上一篇关于字符串搜索文章 ,作者提供了一个检索的思路,我就偷懒学习一下,呵呵。 大致的问题原型是就是indexof的实现问题 基本思路按照子串在原串中检索,如果遇到不匹配的...

沧海一声笑 发布于 2009-08-14 11:28 评论(1) 阅读(609)
0

关于字符串效率问题

最近开始着手研究一下字符串的效率问题,大致了解了一下常规提高性能的方法。现在考虑以前碰到的一个题目:有一个很长的字符串,需要统计其中字母的出现频率。我的大致思路是: 1 不管怎么样,都得循环一遍,最好能保证循环一遍就统计完 2 在循环的时候,涉及到对比的情况 比如,循环碰到字符f,起码f当前的次数有...

沧海一声笑 发布于 2009-08-14 00:32 评论(10) 阅读(560)
0

C# 字符转ASCII码,ASCII码转字符 [转一下]

-->public static int Asc(string character){if (character.Length == 1){System.Text.ASCIIEncoding asciiEncoding = new System.Text.ASCIIEncoding();int...

沧海一声笑 发布于 2009-08-13 23:59 评论(0) 阅读(3519)
30

盘古分词--功能简介

盘古分词--功能简介作者:eaglet 两年前我开发了一个KTDictSeg 中文分词组件,这个组件推出2年来受到很多朋友的喜爱。不过由于我当初开发KTDictSeg时比较仓促,底子没有打好,而且当时对分词的理解也比较肤浅,所以KTDictSeg组件存在很多问题,我一直想重新开放一个更好的开源分词组...

eaglet 发布于 2009-08-13 16:50 评论(126) 阅读(46365)
3

Hack in Lucene.Net之为什么无法在搜索时统计分类下相关结果数或者实现Group By效果

Birdshover 发布于 2009-08-12 23:49 评论(1) 阅读(2896)

团队名称

  • 搜索引擎研究团队

团队简介

  • 共同讨论 .net 相关的搜索引擎,全文索引,分词,数据挖掘,Lucene等相关技术

团队负责人

团队成员

1. 楠小楠 2. Macou 3. kutasms 4. 汝熹 5. msikruby 6. android_test 7. 代码乱了 8. Charleston 9. fxh嘟嘟 10. Soli 11. colvinliu 12. paymob 13. DukeCheng 14. 侯垒 15. Mr__BRIGHT 16. searchDM 17. 麒麟 18. 小砖 19. 刘志斌 20. 永不满足 21. 上不了岸的鱼 22. 时之沙漠 23. LeftNotEasy 24. jowo 25. New.min 26. coffee 27. 微微一记 28. 温伟鹏 29. 码尔代夫iimax 30. 醉春风 31. xiaotie 32. 红魔 33. Todd Wei 34. Ray Wu 35. 西越泽 36. 布尔 37. DavidZang 38. Birdshover 39. microdot 40. KIEKI 41. 倾城绝厉 42. 戏水 43. 孤剑 44. 要有好的心情 45. 已重置 46. Jeff Liu 47. _火车头_ 48. 混在澳洲 49. vsover 50. 老万 - 一刀 51. luotong 52. Rindy 53. 小田好好先生 54. liangzhimy 55. hustnn 56. sinace 57. 爱在戏院前 58. yuzhongwusan 59. 沧海一声笑 60. 刘亮 61. 老海 62. .net 学习 63. 暗香浮动 64. Nick_zhou 65. 大熊先生|互联网后端技术 66. Fly Away 67. J.J.J 68. 李弼翀 69. Mr.Bean 70. . ℡歪歪﹖ 71. CnGine 72. 螞蟻漫步 73. Orison 74. 代码泪 75. SPARON 76. ddr888 77. yuejianjun 78. 吴秦 79. Care健康 80. sky_line 81. iSun 82. H.Wong 83. Dev.Hong 84. gzl 85. eaglet 86. sunmoonone 87. 灰鸽子 88. Zhou Hr 89. 小灰 90. Macly 91. chris_thanks 92. 恩电 93. 兴舟 94. 编程入门 95. YY哥 96. 胡杰 97. 儒门布衣 98. 逸水寒 99. leon_zhao 100. 半克拉鹅卵石 101. 永不言败 102. 极地银狐.NET 103. CleverDeng 104. xiaodongrush 105. hallo 106. xaolo 107. AnsenQ 108. dlbrant 109. 5D开心博客 110. da胖小子 111. Chris Cheung 112. ZhangPeng.Chen 113. chen eric 114. BraveChen 115. 秋风落叶扫 116. coodoing 117. charlie 118. 闻滨 119. 步碎酒散花醉 120. lmllouk 121. zzjj 122. 周鹏 123. 红民 124. 无情的绝情 125. 工本 126. caitou 127. 邪恶梦想 128. AlexLiu 129. 大侃而谈 130. 清水湾 131. I'm September 132. ivanxu 133. 时之砂 134. F_Rock 135. 尊敬 136. wiseshrek 137. 地狱伞兵 138. 郭大少 139. 简单不简单 140. Miser 141. __老___徐__ 142. 淹死的鱼 143. 卡鲁 144. 咸蛋超人 145. 邱鹏 146. cn罗克 147. wingoo 148. Ω元素 149. 海皮球 150. 二叉树 151. 尼采 152. 雨中漫步的太阳 153. Cobain 154. Tom_Net 155. 雷雨飘飞 156. zjyahehe 157. 小绿 158. 王国金 159. 久月 160. Alan@Net 161. liuxinglanyue 162. 刘晓伟 163. achilles.war 164. 双击 165. san. 166. qxfly 167. 流星陨落 168. M 169. Sailor.lee 170. wayleind 171. Mat 172. Yin.P 173. anymt 174. kevin002 175. 青蛙王 176. greater 177. caixiaoniao 178. 装不满的瓶子 179. 泊远 180. PassCar 181. GeorgeHuang 182. roc1982 183. 李大帅 184. Stephen huang 185. blueyund 186. 逆道 187. DavidYang 188. Jimmy_Liu 189. guizi20053269 190. 杨发达 191. 想吓死鬼 192. cyberhunter 193. DarrenQi 194. icerain 195. 束居 196. 爱你随风 197. 周海 198. 肖锋 199. 落_叶 200. Geeks