摘要: <!--选项开始--><div class="jgfangshi Lhk"> <ul class="jquser6" > <li><a href="#">利好</a></li><li><a href="#">利空...
阅读全文摘要: 在做ajax页面无刷新添加的时候,IE下遭遇Ajax缓存,因为刚开始并不知道IE有这个坏毛病,折腾好久,终于解决问题。总结一下解决办法: 在IE下用Ajax请求某一页面,通常会因为缓存的原因而返回上一次的结果,造成混乱,[即get方式时,获取数据,因发送参数和地址都一致,故IE浏览器会从缓存中取,而不会去请求服务器端,而post方式因为参数的不同,不会产生这个问题]而FF下不会出现这种情况。为了不...
阅读全文摘要: 在一个数组中。若你需要频繁的计算一段区间内的和,你会怎么做?,最最简单的方法就是每次进行计算,但是这需要O(N)的时间复杂度,如这个需求非常的频繁,那么这个操作就会占用大量的CPU时间,进一步想一想,你有可能会想到使用空间换取时间的方法,把每一段区间的值一次记录下来,然后存储在内存中,将时间复杂度降低到O(1),的确,对于目前的这个需求来说,已经能够满足时间复杂度上的要求,尽管带来了线性空间复杂度...
阅读全文摘要: 经过2周多的努力,HubbleDotNet 的内存索引功能终于搞好了。有了内存索引,搜索不再去读硬盘,实时性大大提高了。hubble的内存索引不同于lucene 的内存索引,本文将具体介绍一下hubble 的内存索引功能和一些内部机制。
阅读全文摘要: 想提高百度收录量吗?只有被百度收录的页面才有可能从搜索引擎上获得流量这是个不争的事实,百度收录量在某种程度上可以提高网站的知名度,促进流量的攀升,所以,在中小型网站起步阶段,想办法提高网站百度收录量和增加百度友好度就是一项很重要的工作了。作为国内草根站长的一员晓波SEO自习室,在长期的工作过程中,也慢慢的积累了一些经验,简单的总结如下,以期对大家在网站建站初期有所帮助
阅读全文摘要: 1.1.4.0 版本对底层的查询算法做了很大改进,特别是对单个关键字的查询速度,原来版本当匹配100万时用时 130ms,这个版本用时只有30ms。这个速度大概是 lucene.net 的三倍左右。
阅读全文摘要: V 2.3.3.0 版本改进了批量导入功能可以批量导入单词,词性和词频了。
阅读全文摘要: 支付宝事件持续发酵,其影响已经远远超出一家公司内部的股东纷争,甚至也不是契约精神所能涵盖。回头重新去看马云与胡舒立的对话,也许更便于勾画这个事件背后的思维逻辑。而且,由于胡舒立保存着这次对话的全部短信记录,应该可以保证这是原汁原味的马云原话,不会出现转述者的误解,甚至出现“并未讲过”之类的尴尬。马云的话之一:“我理解的支付数据的安全是任何国家不会轻易放弃的,是安全问题而不是民族问题。”《新世纪》的...
阅读全文摘要: 马云遇劲敌:顺丰大兴电子商城 京东自建支付体系 这次,阿里巴巴董事局主席马云押宝“大物流”,真的碰到对手了。 18年来“绝缘媒体”的顺丰快递总裁王卫,破天荒地走到台前,放言“在物流业做大之后,顺丰将在电子商务和金融业务上开疆辟壤。”而其出手之快更是令人咋舌:日前上线的“顺丰E商圈”网站上,“顺丰速运”LOGO被摆在页眉这一显眼位置,支付工具“顺丰宝”也放到“支付宝”之前。 与此同时,京东商城CEO...
阅读全文摘要: HubbleDotNet 在设计之初就定位为一个开放式的搜索平台,分词器,得分算法,数据库适配器,存储过程,函数等等都可以通过编写自定义的插件来定制。目前版本分词器,数据库适配器的自定义接口已经开放,得分算法的自定义接口也将在最近开放出来。本文将讲述如何编写自己的分词器。
阅读全文摘要: 全文索引的分布式检索粗想想似乎很简单,感觉就是把多个接入点搜索出来的数据做个合并排序就可以,但如果想要做好,满足商业应用要求,这里面涉及到很多算法优化的问题,比如多路排序的优化,动态路由,翻页的优化,通讯的优化,分发复制,冗余和故障转移等等。从今天开始,我将逐步讲解HubbleDotNet 在分布式检索方面的众多算法考虑。由于涉及的算法很多,无法在一篇全部阐述,我打算采用由浅入深的思路,先从比较简单的算法开始。本文将介绍翻页的优化技术。
阅读全文摘要: HubbleDotNet 目前已经有很多用户,但大部分用户还仅仅停留在使用层面,真正深入去研究和了解的人不是很多。作为一个开源项目,HubbleDotNet 除了可以提供应用的需要外,其本身的代码对希望了解信息检索和底层软件开发技术的开发人员也应该有一定的参考作用。为了方便对这方面感兴趣的开发人员阅读和理解 HubbleDotNet 的代码,我把HubbleDotNet 的软件设计架构公布出来,供大家参考。HubbleDotNet中文社区 目前还不是很活跃,主要还是我一个人在回答其他网友的提问,我希望对这方面有兴趣的网友在深入了解了HubbleDotNet 的内部机制后,可以更多的参与到这个社区的建设中来,众人拾柴火焰高。
阅读全文摘要: HubbleDotNet 1.1 版本提供了一个后台任务调度功能,这个功能可以让你设置一些后台任务来定时执行一些系统维护操作,比如同步数据,优化索引等等。以前版本这些功能都需要使用者自己编程实现,1.1 以后版本只需要做个设置就可以了,不需要写任何代码了。
阅读全文摘要: HubbleDotNet 从 2009 年11月发布第一个版本(0.7) 到现在,经历了数百个小版本,增加了数十个功能,性能方面也大幅提高。用户数也稳步增长,今天终于突破1000.
阅读全文摘要: Lucene.net 项目有将近1年没有出官方版本了,从去年年初就听说好像出什么问题了,但一直没有看到官方说法。最近搜了一下,这个项目好像确实停了。Apache 开源基金会已经把这个项目的主页下掉了,放到孵化器里面去了。这个项目目前用户还是很多的,包括博客园的找找看,我估计也是基于这个 lucene.net 的,停了还是比较可惜的,希望它的分支能继续发展起来。下面把我看到的相关文章,我大概给介绍一下,看看这个项目到底是出了什么问题。
阅读全文摘要: V1.1.0.0 官方版本今天终于上线了。和上一个官方版本 V0.9.6.0 比起来,V1.1 版本增加了很多的功能,性能方面也大幅提高。下面列举一下 V1.1 版本的改动说明
阅读全文摘要: 今天专门测试了对索引文件全部缓存到内存以及对单词的倒排索引结果进行缓存。测试下来文件缓存到内存对搜索的速度提高非常有限,即便在磁盘的 Avg Disk Queue length = 100 时,性能的提升也很有限。分析下来,原因大致是因为顺序读取文件时操作系统已经做了缓存。 而倒排结果的缓存对性能提升能起到一定的作用,但在返回结果集 100万以下时,提升有限。今天测试返回结果集达到 780 万时,...
阅读全文摘要: 版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com。如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任。 前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,...
阅读全文摘要: 编程中经常遇到很多条件,以及条件套条件的情况,以至于一个方法会写得非常地长。有多种方法可以规避这个问题。比如反射,策略模式,表驱动等等。先抛开这些方法不讲,从根本需求来探索这个过程。
阅读全文摘要: 版权说明: 本文由 LeftNotEasy 原创,联系方式wheeleast@gmail.com 本文可以被任意的转载,请保留完整的文章(含版权说明)。如果商用,请联系原作者。 发布于http://leftno...
阅读全文