信息时代的生存哲学

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

文章分类 -  个性化搜索引擎

摘要:编写Robot应注意的事情 原文:http://www.robotstxt.org/wc/guidelines.html 使用Robot前应多考虑一下,是否有必要自己再写一个Robot,因为现在已经有很多的Search Engine可以使用. 访问一个网站时,要注意访问深度,不要访问得太深(当然,分析网站结构的机... 阅读全文
posted @ 2004-10-10 16:31 信息时代的生存哲学 阅读(764) 评论(0) 推荐(0)

摘要:信息检索的核心支撑技术 作者:北京拓尔思信息技术有限公司总经理 施水才 发表:2003.08.11 来源:中国计算机用户—赛迪网 (Information Retrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。 目前,信息检索已经发展到... 阅读全文
posted @ 2004-10-10 15:37 信息时代的生存哲学 阅读(897) 评论(0) 推荐(0)

摘要:Google的PageRank算法学习(3) 继续学习。 1、很多针对搜索引擎做网站优化的专家,认为google给一些特殊站点以特定的级别而不是按前述算法进行计算,这些网站的级别很有可能来在Yahoo或ODP(Open Directory Project)。Lawrence Page在他们的专利说明中,提到随机冲浪模型中,用记不愿继续点击时,很有可能借助Yahoo的目录或ODP到另一个站点去。... 阅读全文
posted @ 2004-08-17 15:38 信息时代的生存哲学 阅读(738) 评论(0) 推荐(0)

摘要:Google的PageRank算法学习(2) 继续学习。 1、入链对计算页面级别的影响 入链总是能增加当前页面的级别,尤其当前页与其下级页面构成回路时,这种贡献更大。如右图例,设ABCD各页初始级别为1,阻尼系数为0.5,PR(X)/C(X)=10。则易算出 PR(A) = 19/3 = 6.33PR(B) = 11/3 = 3.67PR(C) = 7/3 = 2.33PR(D) = 5/... 阅读全文
posted @ 2004-08-17 15:32 信息时代的生存哲学 阅读(893) 评论(0) 推荐(0)

摘要:Google的PageRank算法学习 据车东在CNBLOG推荐文章,作的学习笔记。 1、PageRank(网页级别)的概念 互联网发展早期的搜索引擎,对web页面的排序,是根据搜索的词组(短语)在页面中的出现次数(occurence ),并用页面长度和html标签的重要性提示等进行权重修订。链接名气(link popularity)技术通过其它文档链接到当前页面(inbound links)的... 阅读全文
posted @ 2004-08-17 15:27 信息时代的生存哲学 阅读(805) 评论(0) 推荐(0)

摘要:搜索引擎技术核心揭密(PHP) 编者按:这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。 谈到网页搜索引擎时,大多数人都会想到雅虎。的确,雅虎开创了一个互联网络的搜索时代。然而,雅虎目前用于搜索网页的技术却并非该公司原先自己开发的。2000年... 阅读全文
posted @ 2004-08-11 16:31 信息时代的生存哲学 阅读(761) 评论(0) 推荐(0)

摘要:网探介绍 网探是搜索客在搜索引擎基础上开发出来的一项增值服务。使用这一服务,客户可以在不改变自己系统的情况下实现内部全文检索功能。整个检索服务运行在搜索客自己的超强服务器之上。检索速度、检索可靠性能够得到极好的保证。 网探的运行原理 当您使用网探的服务之后,只要在主页中加入一段我们提供的HTML代码(即搜索时候的查询框)插入自己的主页。搜索客的spider会自动到您的站点进行数据采集,... 阅读全文
posted @ 2004-08-11 13:39 信息时代的生存哲学 阅读(884) 评论(2) 推荐(0)

摘要:Google排名的因素 Google排名的方法虽然复杂,但是并不神秘。首先,我们要了解营销Goole排名效果的因素,Google的排名因素对于外界来说一直都是秘密,因为Google作为世界上搜索引擎行业的老大,要维护自己搜索质量最高,必须保密它自己的排名因素,并且不断的改变它的排名因素。国内外的SEO已经只能靠自己的观察、试验去不断的总结。本站顾问王通根据自己对Google长期的研究以及对自己60... 阅读全文
posted @ 2004-08-11 13:30 信息时代的生存哲学 阅读(561) 评论(0) 推荐(0)

摘要:使用Google Adwords关键词广告须当心的7个问题 Google的Adwords关键词广告不愧为一个特别棒的工具!使用得当的话可以吸引大批高度定向的客户,并让他们疯狂采购你的产品。但另一方面,如果你不小心,关键词广告也是掏空你广告费的地方。和任何其他自动系统一样,Adwords关键词广告同样要求不断的投入和关注,才能防止我们得不偿失投,投入了大量的广告费用却获得了极少的回报。以下是我发现... 阅读全文
posted @ 2004-08-11 13:29 信息时代的生存哲学 阅读(584) 评论(0) 推荐(0)

摘要:搜索引擎分类 搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。 ■ 全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Te... 阅读全文
posted @ 2004-08-11 13:29 信息时代的生存哲学 阅读(2579) 评论(0) 推荐(0)

摘要:SES(搜索引擎策略)会议记要--报告C 编译:作者简介:阿兰.威伯(Alan Webb:搜索引擎市场顾问,ABAKUS网络市场营销公司的CEO) 主持人: 茱丽安.史密斯(Julian Smith) (互联网调查公司Jupiter Research) 发言人: 杰克.贝里 (Jake Baillie) (Priva公司) 米克尔.斯万德森 (Mikkel deMib Svendson) (Mar... 阅读全文
posted @ 2004-08-11 13:27 信息时代的生存哲学 阅读(563) 评论(0) 推荐(0)

摘要:SES(搜索引擎策略)会议记要--报告B 作者简介:阿兰.威伯(Alan Webb:搜索引擎市场顾问,ABAKUS网络市场营销公司的CEO) 根据自己以往对图片的ALT属性优化的研究工作,吉尔.瓦兰提出:1. 搜索引擎会忽略掉那些没有链接的图片的ALT说明文字内容。 2. ALT文字属性在搜索引擎排名中的比重非常之小。 3. 无论图片是否有链接,即使从实用性和访问性角度考虑,亦应添加适当的ALT属... 阅读全文
posted @ 2004-08-11 13:27 信息时代的生存哲学 阅读(744) 评论(0) 推荐(0)

摘要:SES(搜索引擎策略)会议记要—报告A 编译:作者简介:阿兰.威伯(Alan Webb:搜索引擎市场顾问,ABAKUS网络市场营销公司的CEO) 会议主题:搜索引擎策略研讨 召开时间:6/2-6/3/2004 召开地点:英国伦敦 为期两天的SES(搜索引擎策略)会议于2004年6月2日在英国伦敦召开。与会者包括来自Google的开发人员马特.卡茨(Matt Cutts)和来自Yahoo!/Over... 阅读全文
posted @ 2004-08-11 13:27 信息时代的生存哲学 阅读(515) 评论(0) 推荐(0)

摘要:搜索引擎技术:系统架构 互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,... 阅读全文
posted @ 2004-08-11 13:20 信息时代的生存哲学 阅读(988) 评论(0) 推荐(0)

摘要:使用Lucene建立自己的搜索引擎 lucene是一个极其灵活的开放源代码的搜索引擎。 Lucene会直接同你的Web应用程序集成到一起。它是由Jakarta Apache工作组使用Java编写成的。你的Java应用程序能够将Lucene作为任何搜索功能的核心来使用。Lucene能够处理任何类型的文本数据;但是它没有内置对Word、Excel、PDF和XML的支持。但是还是有一些解决方案... 阅读全文
posted @ 2004-08-11 13:06 信息时代的生存哲学 阅读(2143) 评论(1) 推荐(0)