进入网站后台代码,多用户商城系统哪种好用,学生网站做兼职,网页设计与制作第75页代码HTML作为一种开放标准的网页标记语言#xff0c;具有跨平台、易于浏览和搜索引擎友好的特性#xff0c;使得内容能够在多种设备上轻松访问并优化了在线分享与互动。通过将PDF文件转换为HTML格式#xff0c;我们可以更方便地在浏览器中展示PDF文档内容#xff0c;同时也更容…HTML作为一种开放标准的网页标记语言具有跨平台、易于浏览和搜索引擎友好的特性使得内容能够在多种设备上轻松访问并优化了在线分享与互动。通过将PDF文件转换为HTML格式我们可以更方便地在浏览器中展示PDF文档内容同时也更容易集成到更复杂的HTML页面中。使用C#在.NET框架下我们可以实现更快的转换过程以及转换的自动化进行。本文将介绍如何在.NET框架使用C#将PDF文件转换为HTML格式。 文章目录 用C#直接转换PDF文件为HTML格式转换PDF到HTML时自定义转换选项在字节流中实现PDF到HTML的转换 本文所使用的方法需要用到免费的Free Spire.PDF for .NETNuGetInstall-Package FreeSpire.PDF。
文中所用的示例PDF文档
用C#直接转换PDF文件为HTML格式
我们可以使用PdfDocument.LoadFromFile()方法从文件载入PDF文档然后再使用PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)方法将PDF文档直接转换为HTML文件并保存。以下是操作步骤示例
导入所需模块。创建PdfDocument实例并使用PdfDocument.LoadFromFile()方法从文件载入PDF文档。使用PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)方法将PDF文档直接转换为HTML格式并保存到文件。释放资源。
代码示例
using Spire.Pdf;namespace PDFToHTML
{class Program{static void Main(string[] args){// 创建PdfDocument实例PdfDocument pdf new PdfDocument();// 载入PDF文件pdf.LoadFromFile(Sample.pdf);// 将PDF转换为HTML并保存pdf.SaveToFile(output/PDFToHTML.html, FileFormat.HTML);// 释放资源pdf.Dispose();}}
}运行结果
转换PDF到HTML时自定义转换选项
在载入 PDF 文档后可以通过访问文档的PdfDocument.ConvertOptions属性获取PdfConvertOptions实例。随后可调用PdfConvertOptions.SetPdfToHtmlOptions()方法设置转换选项。该方法接受以下四个参数
bool: 是否将 SVG 嵌入到 HTML 中bool: 是否将图像嵌入到 HTML 中int: 单文件最大页数bool: 是否使用高质量嵌入 SVG。 以下是具体操作步骤的示例
导入所需模块。创建PdfDocument实例并使用PdfDocument.LoadFromFile()方法从文件载入PDF文档。访问文档的PdfDocument.ConvertOptions属性获取PdfConvertOptions实例。调用PdfConvertOptions.SetPdfToHtmlOptions()方法设置转换选项。使用PdfDocument.SaveToFile(string: fileName, FileFormat.HTML)方法将PDF文档转换为HTML格式并保存到文件。释放资源。
代码示例
using Spire.Pdf;namespace PDFToHTML
{class Program{static void Main(string[] args){// 创建PdfDocument实例PdfDocument pdf new PdfDocument();// 载入PDF文件pdf.LoadFromFile(Sample.pdf);// 访问ConvertOptions属性PdfConvertOptions toHtmlOptions pdf.ConvertOptions;// 设置转换HTML选项toHtmlOptions.SetPdfToHtmlOptions(false, true, 5, false);// 将PDF转换为HTML并保存pdf.SaveToFile(output/PDFToHTML.html, FileFormat.HTML);// 释放资源pdf.Dispose();}}
}运行结果
在字节流中实现PDF到HTML的转换
除了从磁盘载入PDF文件转换为HTML格式外我们还可以使用PdfDocument.LoadFromStream()方法直接载入流中的PDF文档然后使用PdfDocument.SaveToStream(Stream: stream, FileFormat.HTML)将PDF文档转换为HTML文件流。以下是操作步骤示例
导入所需模块。创建MemoryStream实例或使用现有实例。创建PdfDocument实例使用PdfDocument.LoadFromStream()从流载入PDF文档。使用PdfDocument.SaveToStream(Stream: stream, FileFormat.HTML)将PDF文档转换为HTML文件流。将流写入文件或根据需要进行其他操作。释放资源。
代码示例
using Spire.Pdf;namespace PDFToHTML
{class Program{static void Main(string[] args){// 创建Stream实例或使用现有实例MemoryStream stream new MemoryStream();File.OpenRead(Sample.pdf).CopyTo(stream);// 创建PdfDocument实例PdfDocument pdf new PdfDocument();// 从流中载入PDF文件pdf.LoadFromStream(stream);// 将PDF转换为HTML并保存到流pdf.SaveToStream(stream, FileFormat.HTML);// 将流写入文件或根据需要进行其他操作File.WriteAllBytes(output/PDFToHTMLStream.html, stream.ToArray());// 释放资源pdf.Dispose();}}
}运行结果
本文介绍如何在.NET框架使用C#将PDF转换为HTML格式提供步骤介绍及代码示例。