将 PDF 转换为 Excel

您可以在 .NET 应用程序中以编程方式轻松地将表格数据从 PDF 文件导出到 Excel 工作表(.xlsx.xls)。当您需要编辑数据或需要应用 Excel 中可用的各种计算时,这种转换很有用。在本文中,您将学习如何使用 C# 将 PDF 转换为 Excel

本文将涵盖以下主题:

C# API 将 PDF 转换为 Excel

我将使用 GroupDocs.Conversion for .NET APIPDF 转换为 XLSX。该 API 提供了一种快速、高效、可靠的文件转换解决方案到 .NET 应用程序中,而无需安装任何外部软件。它还使您能够使用 C#、ASP.NET 和其他 .NET 相关技术构建功能强大的文档转换应用程序。

您可以下载 API 的 DLL 或使用 NuGet 安装它。

Install-Package GroupDocs.Conversion

使用 C# 将 PDF 转换为 Excel

您可以按照以下简单步骤将 PDF 文档转换为 Excel:

  1. 如果适用,请设置 PdfLoadOptions
  2. 使用 SpreadsheetConvertOptions 设置转换选项
  3. 创建 Converter 类的实例
  4. 提供文件路径和加载选项
  5. 调用 Convert 方法以及输出文件路径和转换选项

以下代码示例展示了如何使用 C# 将表格数据从 PDF 文件导出到 Excel 工作表

// PDF 加载选项
GroupDocs.Conversion.Contracts.Func<LoadOptions> getLoadOptions = () => new PdfLoadOptions
{
    FlattenAllFields = true,    // all fields in the source document will be flatten during conversion
    Password = "123"            // provide password if document is password protected
};

// Excel 转换选项
SpreadsheetConvertOptions options = new SpreadsheetConvertOptions
{
    PageNumber = 1,                     // Starting page number
    PagesCount = 1,                     // Total pages to convert
    Format = SpreadsheetFileType.Xlsx,  // Conversion format
    Password = "password",              // Set password for converted file
    Zoom = 110                          // Zoom level
};

// 将 PDF 转换为 XLSX
Converter converter = new Converter("C:\\Files\\sample.pdf", getLoadOptions);
converter.Convert("C:\\Files\\converted.xlsx", options);
将 PDF 转换为 XLSX

将 PDF 转换为 XLSX

PdfLoadOptions 类提供加载 PDF 文档的各种选项。这些 properties 包括 FlattenAllFields、HidePdfAnnotations、PasswordRemoveEmbeddedFiles。您可以在 文档 中找到更多详细信息。

SpreadsheetConvertOptions 类提供某些 properties 用于将文件从其他格式转换为电子表格文件类型。

  • PageNumber 属性定义要转换的源文档的起始页码。
  • PagesCount 属性定义从 PageNumber 开始要转换的总页数。
  • 您可以通过向 Pages 属性提供页面索引列表来转换特定页面。
  • 您可以使用 Password 属性为转换后的文件设置密码。
  • Zoom 属性可用于设置转换文件的缩放级别(以百分比表示)。
  • Format 属性定义转换后文件的输出格式。

您可以在文档中找到有关“使用高级选项转换为电子表格”的更多详细信息。

获得免费许可证

您可以通过请求 免费的临时许可证 来试用该 API,而不受评估限制。

结论

在本文中,您学习了如何使用 C# 将表格数据从 PDF 文档导出到 Excel 工作表。您可以使用 文档 了解有关 GroupDocs.Conversion .NET API 的更多信息。如有任何歧义,请随时在 论坛 上与我们联系。

也可以看看