让SharePoint 2010可以搜索PDF文件类型

让SharePoint 2010可以搜索PDF文件类型

默认情况下我们在SharePoint 2010文档库中上载一个PDF类型的文件,由于受到版权问题,文档库是不识别上载的PDF类型文件的。而在搜索中心或搜索框中输入与PDF类型文件相关的关键词时,SharePoint 2010也是搜索不出来的,因为默认情况下搜索服务应用程序的文件类型中是没有.pdf文件类型的。

虽然默认情况下不支持PDF文件类型的搜索,但是可以通过扩充的方法让SharePoint 2010可以搜索PDF类型的文件。

当我们在文档库中上载一个文件时,如果是受支持的文件类型,则会把相应的文件类型图标显示出来,反之则显示一个不被支持的文件类型的图标。如图1所示:

在文档库中上载一个PDF类型的文件

图1

在图1中除了选中的文档以外,其它的文档都是Word文档,“类型”栏下都出现了一个Word文件类型的图标,而图1中选中的那个文件是PDF文件类型,但由于SharePoint 2010不支持PDF文件类型,所以“类型”栏显示的是一个不被识别的类型图标。现在我们稍作修改,让文档库能够识别出PDF类型的文件。

其实SharePoint 2010的所有文件类型的图标路径都是存储在一个叫做DOCICON.XML文件中的。完整的路径为:

D:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\TEMPLATE\XML\

使用记事本打开这个DOCICON.XML文件,如图2所示:

SharePoint 2010的DOCICON.XML文件

图2

在图2的XML文件中,<ByExtension>标记与</ByExtension>之间的内容就是各个文件的类型图标的路径和其它配置。现在我们到Adobe官方网站上下载一个16*16的图标,下载地址为:http://www.adobe.com/images/pdficon_small.png,并把下载的这个pdficon_small.png图标文件复制到如下路径:

D:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\TEMPLATE\IMAGES\

然后再下载一个名为“PDFiFilter64installer.zip”的服务器端安装程序安装到SharsePoint 2010 Web服务器上,下载地址为:http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=4025&fileID=3941

“PDFiFilter64installer.zip”安装完成之后,把下面的代码:

<Mapping Key="pdf" Value="pdficon_small.png"/>

复制到图2的<ByExtension>和</ByExtension>标记的最后。如图3所示:

在DOCICON.XML文件中添加PDF文件类型的图标

图3

保存图3的内容,如果保存时出现“另一个程序正在使用此文件,进程无法访问。”的提示信息,则就重启一下IIS。返回到图1刷新一下,结果如图4所示:

在文档库中已经识别出PDF类型的文件了

图4

如图4所示,选中的那个PDF类型的文档已经正确的被SharePoint 2010文档库识别了并显示出了PDF类型图标。

现在让我们配置爬网搜索,打开管理中心的“管理服务应用程序”页面,如图5所示:

配置Search Service可以搜索PDF文件类型

图5

在图5中找到“Search Service Application”服务应用程序,并选中点击顶部功能区的“管理”图标,如图6所示:

管理中心 爬网设置中的文件类型

图6

在图6中点击“文件类型”链接,如图7所示:

指定要在内容索引中包含的文件类型页面

图7

图7中都是可以被搜索到的文件类型,就是没有pdf文件扩展名,现在我们在图7中点击“新建文件类型”,如图8所示:

为SharePoint 2010爬网配置文件扩展名

图8

在图8的文件扩展名文本框中输入“pdf”点击“确定”按钮,如图9所示:

爬网搜索中已配置好的PDF文件类型

图9

如图9所示,pdf文件扩展名就被添加上去了,这也表示SharePoint 2010的搜索现在已经支持pdf文件了。

在图6中点击“内容源”,如图10所示:

在管理中心启动完全爬网

图10

在图10中点击“启动完全爬网”来执行一次对PDF类型文件的收集,爬网完成之后,我们在搜索中心搜索PDF文件,如图11所示:

在SharePoint 2010中搜索PDF文件

图11

如图11,我们在图4中看到的PDF文件已经被SharePoint 2010的搜索中心搜索出来了。

posted @ 2013-01-07 17:25  anshen+  阅读(422)  评论(0编辑  收藏  举报