在日常开发或办公场景中,PDF 文档对比是高频需求(如合同版本迭代校验、技术文档审核、报表一致性验证等)。市面上虽有 Adobe Acrobat 等可视化对比工具,但通过编程实现 PDF 对比可满足自动化、定制化的业务需求。本文将介绍如何使用免费库 Free Spire.PDF for .NET 对比两个 PDF 文档。
一、核心组件:PdfComparer 类
PdfComparer 是 Free Spire.PDF for .NET 提供的高阶封装类,专为 PDF 文档对比设计:它会自动分析两个 PDF 的内容差异(文本增删、修改等),并将对比结果输出为新的PDF文档。
比较结果的呈现方式
生成的比较结果文档采用直观的视觉标注:
- PDF 完全一致:无高亮标记,仅展示原文档内容
- 新增内容:通常以黄色高亮显示
- 删除内容:通常以红色高亮标记
二、安装 Free Spire.PDF
推荐通过 NuGet 包管理器安装,步骤如下:
- 打开项目,右键点击“管理NuGet程序包”;
- 搜索“FreeSpire.PDF”,选择最新稳定版安装;
或通过NuGet命令行安装:
Install-Package FreeSpire.PDF
三、如何通过 C# 对比两个 PDF 文档
核心思路:
Free Spire.PDF 的对比逻辑极简,无需手动处理页面、文本提取,核心步骤仅4步:
- 实例化
PdfDocument对象,分别加载两个待对比的 PDF 文件; - 实例化
PdfComparer对象,传入两个已加载的 PDF 文档; - 调用
PdfComparer.Compare()方法,指定对比结果PDF的保存路径; - 释放PDF文档资源,避免内存泄漏。
重要说明:免费版本在处理 PDF 时有一定页数限制,但对于大多数基本比较需求已经足够。
完整代码:
以下几行简单代码实现了对比两个 PDF 文档的文本内容:
using Spire.Pdf;
using Spire.Pdf.Comparison;
namespace ComparePDF
{
class Program
{
static void Main(string[] args)
{
// 加载两个待对比的 PDF 文档
PdfDocument pdf1 = new PdfDocument();
pdf1.LoadFromFile("Sample1.pdf");
PdfDocument pdf2 = new PdfDocument();
pdf2.LoadFromFile("Sample2.pdf");
// 实例化PdfComparer,传入两个文档
PdfComparer comparer = new PdfComparer(pdf1, pdf2);
// 执行对比并保存结果PDF
comparer.Compare("ComparingResult.pdf");
pdf1.Close();
pdf2.Close();
}
}
}
基于 PdfComparer 类的 C# PDF 对比方案十分简单高效,无需手动处理底层对比逻辑,且能直接生成带差异标记的 PDF 结果文档,比纯文本差异日志更易阅读。
浙公网安备 33010602011771号