谁将是企业搜索的Google?

通过收购和对搜索技术的大规模研究投资,IBM正悄悄变成一位搜索技术的领先厂商。IBM的搜索目标是使查询企业网络像使用Google或Yahoo进行Web搜索那样普通和容易,IBM会成为企业搜索技术的Google?
   Microsoft也活跃在搜索领域,帮助普及了在PC上搜索的概念。它正在开发一种叫做WinFS的新文件系统,可大大方便挖掘保存在不同程序中的数据的过程。同时,几家较小的专业厂商已经推出了帮助企业用户搜索公司网络的文本存储和检索软件。这些企业搜索公司包括Verity、Autonomy、Fast Search & Transfer以及几家新兴厂商。
   Forrester Research公司分析师Laura Ramos说,企业搜索产品起价一般在3万美元以上,大型部署的费用可能超过100万美元。IDC估计,企业搜索市场2003年取得了6.2亿美元的收入并显示出健康的需求,2004年增长了20%。


桌面搜索进入企业

   桌面搜索技术已问世多年,当Google去年10月推出针对消费者的Google Desktop Search工具时,重新将人们的注意力吸引到这项技术上。
   另一些厂商如Ask Jeeves, Microsoft和Yahoo也纷纷仿效,加入争夺红火PC搜索市场的厂商行列。另一家搜索厂商ISYS Search Software不久前推出了ISYS:desktop 7企业桌面搜索工具。
Gartner研究副总裁Whit Andrews说,对于靠电子邮件收件箱生活并且淹没在信息中的企业用户来说,桌面搜索是必须具备的功能。Andrews说:“不鼓励雇员使用桌面搜索的企业正在把时间丢到一个黑洞中。工作人员越来越生活在电子邮件中,他们将收件箱当做待办事项清单对待,将电子邮件作为知识信息库。强健有效的搜索这些内容的工具将使这些人大大受益。”
   7月1日,新兴企业X1 Technologies公司进军企业桌面搜索领域,加入争夺Google、Verity、 Autonomy等大牌厂商觊觎的企业搜索市场。X1企业版是使企业用户访问保存在PC上的数据和保存在企业数据信息库中的数据的服务器端软件。该产品将X1 Desktop Search界面与集成的网络Content Connectors组合在一起。Content Connectors使用户可以访问共享文件夹、电子邮件信件和附件中的数据以及电子邮件系统中的联系人信息,并可以操作这些信息。
   X1的企业工具可以索引370来种不同的文件类型。它包括部署和管理工具,并可使用已有的IT和安全策略。X1公司营销副总裁Jeff Kupietzky说:“企业用户被淹没在大量的非结构化数据中。但是,大多数IT人员继续将钱花费结构化数据上,进行内容管理和知识管理。”


Google欲赢者通吃

   搜索巨擘Google似乎想赢者通吃,准备在企业搜索领域大干一场。该公司认为企业的搜索需要没有得到满足。
   今年1月,Google公司对其企业Search Appliance进行了改进,使它现在可以索引无法用HTTP协议访问的文档,从而大大扩展了该产品可搜索和检索的数据范围。同时,Google还开始发送价格更低廉的Search Appliance简化版本。这款叫做Google Mini产品设计用于中小企业。
通过两项改进,新版Search Appliance第一次能够访问HTTP Web界面无法显示的文档。这两项改进是:对JDBC的支持,实现对关系型数据库的访问;用于在Search Appliance和软件(如企业业务应用、内容管理软件和遗留系统)数据信息库之间建立链接的“feeder”API。
Google企业总经理Dave Girouard说:“我们添加了与关系型数据库的连接,因为在大型公司中,很多重要的信息自然而然地保存在关系型数据库中。利用feeder API,而不是依靠搜索引擎,   公司中的另一些内容系统可以自动向Search Appliance中输入信息。”
这样,Search Appliance的应用扩展到以前版本的应用范围之外。过去它是一种公司买来让雇员搜索内联网或让访问者搜索公共网站的工具。Search Appliance是一台安装了Google搜索软件的硬件设备。Google还利用一种新的安全API来加强Search Appliance,将它与控制用户访问文档和信息的企业安全系统相集成,使Search Appliance只能向用户提供允许他们访问的文档。Search Appliance现在除英语外还提供5种语言的管理和用户界面:西班牙语、意大利语、德语和日语。Search Appliance是在2002年推出的,有800多家客户购买了该产品。
Forrester Research公司分析师Laura Ramos说,这些扩展代表着“Google在企业领域中良好的、一致的、稳定的发展”。
   Girouard说,Google Mini的未来版本将继承Search Appliance的特性,因此Google Mini可以索引非Web文档。加州Cupertino市De Anza学院使用Google Mini已有一周时间了。学院Web管理员Bradley Creamer说,学院发现这款设备非常有效,设置和配置都十分容易。他说:“很多功能是开箱即用的。使用起来非常容易。”
   Ramos说,因此,Google Search Appliance服务于企业搜索市场的低端,最适合于中小企业和大型公司中的单个部门。同时,Google Mini最初只能够索引通过HTTP可访问的文档,并且最多只能索引5万个文档。Google Mini将由Google网站在线销售,价格是4,995美元。
相比之下,据Google2004年6月提供的价格信息显示,Search Appliance起价为32,000美元,最多可索引150,000个文档,而最大容量为1 50万个文档的版本价格为17.5万美元。Search    Appliance还以预先配置的多台设备的堆叠形式销售。
   Forrester Research公司分析师Laura Ramos说,除此之外,企业搜索产品起价一般在3万美元以上,大型部署的费用可能超过100万美元,这种价格超出了小企业的承受范围。
Ramos也表示,Google的这些扩展仍不足以使Search Appliance达到Verity、 Autonomy和Fast Search & Transfer等厂商的企业搜索产品同样的水平。


IBM欲做企业搜索中的Google?

IBM也在正在开发搜索软件,希望这种软件能使它成为企业搜索技术的Google。据IBM信息集成副总裁Nelson Mattos说:“自2001年起,IBM一直向一项巨大的信息集成项目投资,以帮助公司集成和找到保存在于企业不同位置的任何信息。”
IBM目前正在推广一项新标准。这项标准旨在实现帮助企业搜索和分析分布在企业网络上的非结构化数据的软件之间的互操作性。非结构化数据包括电子邮件、Word文档以及没有以行列格式保存的任何内容。
   IBM公司8月8日发布了新版本的WebSphere Information Integration OmniFind Edition企业信息管理工具。新工具集成了“非结构化管理管理架构”(UIMA)的技术。UIMA设计用于改进对文档和其他非结构化内容源中的文本进行处理,来帮助寻找关键字之外的关系和含意。
Mattos说:“这是企业界存在的头号问题。”他补充说,研究显示工作人员平均将30%的时间花在寻找相关信息上。他说,大约85%的企业数据是非结构化的,因而不容易找到,这一事实使这个问题变得更加复杂。
   IBM说,15家以上的公司已表示计划支持UIMA作为一种搜索和文本分析非结构化数据的框架。目前使用IBM的WebSphere Information Integration OmniFind的项目包括用于汽车业处理保修要求、修理请求和可以帮助确定问题的呼叫中心日志的质量控制预警系统以及用于反恐与执法的高级情报系统。
   Interarbor Solutions分析师Dana Gardner说:“在分析非结构化文本时,现在有很多不同的方法,但是所有这些方法只能让你粗浅地了解你可以得到的东西。”他说,利用UIMA,公司可以更全面地提取他们寻找的信息。
  实际上,据IBM信息管理部总经理Janet Perna说,蓝色巨人一直在悄悄地开发旨在大大提高公司寻找分布在网络不同位置上的业务文档能力的数据存储软件。
这种新软件,连同IBM已经拥有的其他信息检索产品,将支持公司完成脱离低价硬件市场,进军利润更高的软件与服务领域的转变。Perna说,此举旨在加快IBM从一家关系型数据库公司转变为提供各种信息管理软件的提供商的速度。
   Perna说:“我们是靠关系型数据库起家的。我们需要的是一种不仅保存和管理而且还搜索和访问各种信息的信息基础设施。”她说,这种新数据库相关软件将使企业客户可以以XML格式保存文档,这将大大加快文本相关查询的速度。这种工具的一个早期版本,即alpha版本正在由30来家客户进行测试,预计于明年下半年完成。
   关系型数据库是企业的支柱,用于保存记录和交易数据。Perna说,但是,大约85%的业务信息保存在所谓的非结构化数据源中(如字处理文件、XML文档和图像),因而难于查找。他说:“几乎所有人都熟悉像Google或Yahoo这样的搜索功能。因此我的设想是我们可以以类似的模式暴露业务信息。我们将取得成功,因为不需任何培训。”
他说,公司雇员常常通过口头传播来了解业务报告,或者他们委托编写报告,而报告可能已经写出来了并保存在一家公司的服务器上。搜索已有报告信息库将大大加快这一过程,并可能消除某些多余的工作。
   分析人士说,随着IBM扩大自己的范围,可能将与Microsoft和Oracle以及一些专业从事企业搜索(如文本检索)开发的小公司发生冲突。
IDC的Feldman指出,其他公司也在进军企业搜索市场,但销售处理不太复杂任务的较简单的产品。如Google的搜索引擎不允许进行大量的搜索定制。
   Microsoft也活跃在搜索领域,帮助普及了在PC上搜索的概念。它正在开发一种叫做WinFS的新文件系统,以方便挖掘保存在不同程序中的数据的过程。同时,几家较小的专业厂商已推出了使企业用户搜索公司网络的文本存储和检索软件,包括Verity、Autonomy、Fast Search & Transfer以及几家新兴厂商。


搜索企业要复杂得多

   搜索企业网络可能比搜索Web要复杂得多,尽管信息量可能要少得多。
与在Web上不同,企业信息可能保存在很多位置中并且有各种各样的格式,如电子报表、PDF、网页、甚至多媒体文件。企业客户还需要可靠的存储系统(如数据库)以及协作、安全和跟踪法规遵从性的工具。
   另一个与Web搜索的重要不同是企业网络中复杂的搜索应用涉及从多个源采集信息和建立信息的关联。例如,汽车制造商可以通过挖掘保存在客户支持电子邮件和制造应用程序中的文本文档,发现潜在的危险和昂贵的产品缺陷。
   IDC估计,企业搜索市场2003年取得了6.2亿美元的收入并显示出健康的需求,去年增长了20%。IDC分析师Sue Feldman说,随着不同的公司竞争企业信息管理市场的份额,传统内容管理提供商与专业搜索与文本检索公司之间的冲突是不可避免的。
Feldman说:“内容管理厂商和搜索厂商一直非常愉快地共存。现在我们将开始看到两类厂商的联合。这种新兴信息基础设施正是IBM进军的领域,也是Oracle、可能还有其他一些厂商进军的领域。”
   IBM通过收购、通过筛选其研发试验室的成果,构建内容管理与搜索产品线。IBM研究部门中大约有300人致力于搜索相关课题的研发。
包括WebFountain的试验室技术开始出现在产品中。一个名为Cinnamon的项目带来了IBM DB2 Content Manager中XML文档处理功能的改进。DB2 Content Manager预计于明年上半年升级。从发送产品角度看,IBM今年年初在推出DB2 Information Integrator(代号为Masala)时,取得了进入企业搜索领域的立足点。作为IBM数据库的附件,Masala使业务人员可以查询异构的数据源。
   凭借即将推出的XML数据库,IBM将在一种树形结构中保存和索引XML文档,这种保存方法应当大大提高文本的搜索速度。
市场上已出现了专用的、本机的XML数据库,但IBM的Perna说,蓝色巨人的产品将具有工业强度的性能和其DB2产品的规模。Kawasaki的Martinez说,IBM的技术设想十分诱人,因为它的搜索技术是为处理不同类型的信息和操作环境而设计的。
   IBM在关系型数据库市场名声赫赫,并具有大型机数据库提供商这样的遗产,但是直到不久前,它的大多数与搜索相关的工作一直是在试验室中进行的。Martinez说,事实上,蓝色巨人在企业搜索市场中面临的挑战可能是它的形象,而不是实际的技术。
他说:“当你想到搜索时,不会想到IBM。”

计世网消息 2005-8

posted on 2005-11-15 12:07  懒狮  阅读(822)  评论(0编辑  收藏  举报