Open XML应用安全(3)隐藏数据

Open XML应用安全(3)隐藏数据

这里隐藏数据是指Office文档默认存储一些基本属性信息,很有可能会包含一些敏感信息,比如公司、创建者、签名、评论

针对隐藏信息,Office们提供文档检查器。可以按照信任中心→个人信息选项→文档检查器方式打开文档检查器。如图14-26所示。

14-26  文档检查器

文档检查器是用来检查隐藏信息,并提供删除功能。现在再来看Office定义个人信息,包括如下各项:姓名和缩写、公司和组织名称、计算机名、网络服务器和硬盘驱动器、其文件属性和摘要信息、OLE对象、文档不同版本作者信息、文档修订信息、文档版本信息、模板信息、隐藏文本、修订和批注。

当执行检查操作时候,会列出含有隐藏信息项,并给出删除功能,如图14-27所示。

14-27  文档审查结果

如果想实现更灵活功能,可以在代码中调用文档检查器。在C#中,可以通过调用Microsoft.Office.Core.IdocumentInspector接口来调用文档检查器功能。如果VSTO编程基础,可以编写一个Office插件来实现一些自定功能。当然,使用Open XML SDK 提供API可以更方便实现操作隐藏信息功能。代码清单14-22是一个检索Word文档属性例子。

代码清单14-22  检索Word文档属性

public static void GetPropertyFromDocument(string document)

{

   XmlDocument xmlProperties = new XmlDocument();

 

   using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(document, false))

   {

      ExtendedFilePropertiesPart appPart = wordDoc.ExtendedFilePropertiesPart;

 

      xmlProperties.Load(appPart.GetStream());

   }

   XmlNodeList chars = xmlProperties.GetElementsByTagName("Characters");

 

   MessageBox.Show(chars.Item(0).InnerText);

}

在代码清单14-22中,只需注意它是如何提取属性信息即可,只需调用WordprocessingDocument对象ExtendedFilePropertiesPart属性即可。

通过上面例子想告诉各位读者是,所有隐藏信息都会作为文档属性存在,只要去看看API帮助文档就会解一切。同时使用Open XML SDKAPI开发起来要比VSTO容易得多。加深印象,再来看一个移除隐藏文字例子,如代码清单14-23所示。

代码清单14-23  移除隐藏文字

public static void DeleteHiddenText(string filepath)

{

    // Given a document name, delete all the hidden text.

    using (WordprocessingDocument wdDoc =

        WordprocessingDocument.Open(filepath, true))

    {

        Body body = wdDoc.MainDocumentPart.Document.Body;

        var hiddens = body.Descendants<Vanish>();

        foreach (var hidden in hiddens)

        {

            var run = hidden.Parent.Parent;

            run.Remove();

        }

    }

}

在代码清单14-23中,关键代码只有一句:

var hiddens = body.Descendants<Vanish>();

其中,对象Vanish代表隐藏文字。

隐藏数据修改这里就再不演示,读者在解原理之后,在需要时候可以通过Office工具或者自己动手编写代码来消除安全隐患。

 ------------------------注:本文部分内容改编自《.NET 安全揭秘》

posted @ 2012-06-24 16:16  玄魂  阅读(1114)  评论(0编辑  收藏  举报