摘要:量子计算带来超高速和超高效处理的可能性,搜索引擎巨头Google现在也出现在这个领域的风头浪尖上。New Scientist说Google在过去的三年中一直都在研究一种可以自动识别和分类图像或视频的量子算法。量子计算主要关注在原子水平上发生的奇异物理现象。世界上很多研究小组都在为创造以qubits(量子比特)为单位存储信息的量子处理器而努力。它同时可以表示”经典”计算机的二进制中(0和1)逻辑,这...
阅读全文
随笔分类 - Search Engine
摘要:zz http://www.cnbeta.com/articles/89806.htm 首先雅虎决定在其网站使用Bing搜索引擎,这一策略暂时还不清楚是全面替代现有的雅虎搜索,或者是仅仅在雅虎首页使用。这一决定对于雅虎来说影响重大,这将会极大制约雅虎自有搜索引擎的发展,换句话说假设一年以后微软不和雅虎合作了,雅虎的搜索是否能堪重用。 微软与雅虎在搜索业务的合作终于就快完成长达一年的长跑,他们将会在...
阅读全文
摘要:Milabra, 一个为其他网站提供B2B解决方案的新兴图像识别公司,已公诸于众。配合此推出,该公司还宣布了与几个私募投资达成的一项140万美元的融资计划。 Milabra的引擎可广泛识别多种范围的图像,“从小狗到毛片”(他们所言),并有丰富的应用方式,像成人内容拦截及以可检索的元数据 (metadata)自动对图像进行标记。 该公司的图像识别引擎应该是模仿了某些在人类大脑中发现的自然趋势 (M...
阅读全文
摘要:2月中旬,西班牙巴塞罗那的“网络搜索与数据挖掘大会”(Web Search and Data Mining Conference)上,微软将公布他们的最新研究成果——“群体搜索”(groupization). “毫无疑问,这是微软向搜索界霸主谷歌发出的一张战书.”美国《技术评论》(Technologyreview)杂志撰稿人罗伯特·雷姆斯(Robert Lemos)对此评论道.微软该项目的技术负责...
阅读全文
摘要:zz自http://www.cnbeta.com/articles/63224.htm 离开搜索引擎,Internet 将一无是处。随着 Internet 信息的泛滥,搜索引擎的重要性越来越凸显,ReadWriteWeb 的编辑们挑选了三款独特的搜索引擎,它们将改变我们的搜索方式。 Viewzi 毫无疑问,拥有各种可视化功能的 Viewzi 是一款属于未来的搜索引擎,字发布以来,这个可视化搜索引擎...
阅读全文
摘要:硅谷一家名不经传的小公司“Cuil”近日自称推出了互联网上最大的搜索引擎,其索引页面的数量比Google还要大三倍。 这家公司的总裁Anna Patterson此前曾在Google工作,但是她在2006年离开了公司,并和她的丈夫和几位朋友共同创建了Cuil搜索引擎(Cuil发音为“酷”,源自于盖尔语,意为“知识”),她的丈夫Tom Costello此前帮助IBM构建了新型搜索引擎WebFounta...
阅读全文
摘要:根据微软亚洲研究院本周在新加坡会议上发表的研究论文显示,微软正在研究一项替代Google PageRank的算法,BrowserRank。 微软这种新的页面评分机制从网站的用途和用户的行为模式出发,对页面进行评级。Google的算法在目前仍是个谜,PageRank越高,搜索结果越靠前,这种由计算机来处理的方式很客观,但是用户却不清楚Google是怎么给页面评定的级别,而且开发人员也可能通过优化提高...
阅读全文
摘要:PageRank: http://en.wikipedia.org/wiki/Page_rank ; http://download.csdn.net/source/376367 BM25:http://download.csdn.net/source/376362 RankBoost: http://download.csdn.net/source/376396 PRanking: http:/...
阅读全文
摘要:据国外媒体报道,谷歌周一发布了公司内部使用的开源数据描述语言“Protocol Buffers”。Protocol Buffers与XML相似,但其特点是简单、小巧、速度快。 谷歌开源项目经理克里斯·迪邦纳(Chris DiBonap)在博客中称,“我们在网络上传输或在磁盘上存储的几乎所有结构化信息都使用了这种语言。我们认为,Protocol Buffers对其他人也有大有裨益,因此决定把它作为开...
阅读全文
摘要:据路透社报道,一家名为Powerset的硅谷公司开发了一种新的搜索引擎,或许将对Google形成很大的挑战。这种新的搜索引擎更加人性化,它能够识别人类输入的自然语句而开始搜索,比如你可以输入“驱动之家今天最新消息是什么?”来搜索,这个引擎可以很好的识别你的意思,而如果是google,则需要输入“最新 驱动之家”来搜索了。这个搜索引擎将用户输入的内容进行相关性概念检测,使得搜索更加灵活准确,它让你不...
阅读全文
摘要:Google公司日前宣布了一种新的图片搜索算法原型,名为VisualRank。众所周知,PageRank算法是Google页面文字搜索的核心,而VisualRank算法未来有希望成为图片版的PageRank,可见Google对它寄予了厚望。 Google高级研发人员Shumeet Baluja在WWW互联网会议上表示,目前图像识别和搜索技术在整个网络技术大潮中已经远远落在了后面,虽然Google拥...
阅读全文
摘要:Google公司今天宣布,其Googlebot web信息采集系统将开始自动填写HTML表单,并记录反馈结果。 Google搜索引擎似乎在不顾一切的吞食来自互联网的数据,仅去年1年它就吞下了约100 Exabytes(1 Exabyte=1000000000 Gigabyte)的数据。之前Google并不触及大量的深层页面(也就是网站中被隐藏的内容,例如没有连接的页面,非文本的内容,或是动态内容返...
阅读全文
摘要:原文链接: http://hideto.javaeye.com/blog/130815 原文:Google Architecture Google是伸缩性的王者。Google一直的目标就是构建高性能高伸缩性的基础组织来支持它们的产品。 平台Linux大量语言:Python,Java,C++ 状态在2006年大约有450,000台廉价服务器在2005年Google索引了80亿Web页面,现在...
阅读全文
摘要:随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。 随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为...
阅读全文
摘要:前言 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、yisou、中搜等大型搜索引擎一直人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvist...
阅读全文
摘要:随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为学者,会把有代表性的搜索引擎作为研究对象…… 而作为一个网站的经营者,其更关心的或许是如何通过网络载体让更多的网民知道自己的网站,进而获得更高的流量和知名度。这其中,搜索引擎已经成了一...
阅读全文
摘要:互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,但如今这一切已成为了可能...
阅读全文
摘要:一、搜索引擎技术/动态资源、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。2、laolu'blog 有不少来自国外的关于搜索引擎方面的资料,偏重于资料和数...
阅读全文

浙公网安备 33010602011771号