写点什么

如何通过 Java 代码压缩 PDF 文档?

作者:在下毛毛雨
  • 2022-11-15
    四川
  • 本文字数:2368 字

    阅读完需:约 8 分钟

如何通过Java代码压缩PDF文档?

在使用 PDF 文件过程中,经常会出现由于体积过大导致文件传输失败的情况。遇到这种情况,我们可以先将 PDF 文件压缩一下再进行传输。而除了压缩文档内容以外,压缩图片是缩小 PDF 文档的主要方法之一。本文将分为两部分分别介绍如何通过 Java 代码压缩 PDF 文档。希望这篇文章能对大家有所帮助。


  • 压缩 PDF 文档中的内容及图片

  • 压缩 PDF 文档中的高分辨率图像

程序环境

引入 jar 包

导入方法 1:

手动引入。将 Free Spire.PDF forJava 下载到本地,解压,找到 lib 文件夹下的 Spire.PDF.jar 文件。在 IDEA 中打开如下界面,将本地路径中的 jar 文件引入 Java 程序:


导入方法 2:如果您想通过 Maven安装,则可以在 pom.xml 文件中添加以下代码导入 JAR 文件。

<repositories>
<repository>
<id>com.e-iceblue</id>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf.free</artifactId>
<version>5.1.0</version>
</dependency>
</dependencies>
复制代码

压缩 PDF 文档中的内容及图片

  • 创建 PdfDocument 类的对象。

  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。

  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。

  • 使用 PdfDocument.setCompressionLevel() 方法将压缩级别设置为最佳,以压缩文档中的内容。 您可以从 PdfCompressionLevel 枚举中选择其他一些级别。

  • 循环遍历文档中的页面,使用 PdfPageBase.getImagesInfo() 方法获取每个页面的图像信息集合。

  • 遍历集合中的所有项目,并使用 PdfBitmap.setQuality() 方法压缩特定图像的质量。

  • 使用 PdfPageBase.replaceImage() 方法将原始图像替换为压缩图像。

  • 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。

完整代码

Java

import com.spire.pdf.PdfCompressionLevel;import com.spire.pdf.PdfDocument;import com.spire.pdf.PdfPageBase;import com.spire.pdf.exporting.PdfImageInfo;import com.spire.pdf.graphics.PdfBitmap;
public class CompressPDFImage {
public static void main(String[] args) {
//创建 PdfDocument 类的对象。 PdfDocument doc = new PdfDocument();
//加载 PDF 文档 doc.loadFromFile("测试文档.pdf");
//将IncrementalUpdate设置为false doc.getFileInfo().setIncrementalUpdate(false);
//将压缩级别设置为最佳 doc.setCompressionLevel(PdfCompressionLevel.Best);
//循环遍历文档中的页面 for (int i = 0; i < doc.getPages().getCount(); i++) {
//获取特定页面 PdfPageBase page = doc.getPages().get(i);
//获取每个页面的图像信息集合 PdfImageInfo[] images = page.getImagesInfo();
//遍历集合中的项目 if (images != null && images.length > 0) for (int j = 0; j < images.length; j++) {
//获取指定图像 PdfImageInfo image = images[j]; PdfBitmap bp = new PdfBitmap(image.getImage());
//设置压缩质量 bp.setQuality(20);
//用压缩后的图片替换原始图片 page.replaceImage(j, bp); }
//保存文件 doc.saveToFile("output.pdf"); doc.close(); } }}
复制代码

效果图

压缩 PDF 文档中的高分辨率图像

本方法仅对文档中的高分辨率图像进行无损压缩,而低分辨率的图像将不再被压缩。

  • 创建 PdfDocument 类的对象。

  • 使用 PdfDocument.loadFromFile() 方法加载 PDF 文档。

  • 使用 PdfDocument.getFileInfo().setIncrementalUpdate() 方法将 IncrementalUpdate 设置为 false。

  • 声明一个 PdfPageBase 变量。

  • 循环遍历页面并使用 PdfDocument.getPages().get() 方法获取特定页面。

  • 循环遍历页面中的图像。并使用 page.tryCompressImage(info.Index) 方法压缩高分辨率图像。

  • 使用 PdfDocument.saveToFile() 方法将文档保存到另一个 PDF 文件。

import com.spire.pdf.PdfDocument;import com.spire.pdf.PdfPageBase;import com.spire.pdf.exporting.PdfImageInfo; public class CompressPDFImage {    public static void main(String[] args) {         //创建 PdfDocument 类的对象        PdfDocument doc = new PdfDocument         //加载 PDF 文档        doc.loadFromFile("示例文档.pdf");         //将IncrementalUpdate设置为false        doc.getFileInfo().setIncrementalUpdate(false);         //声明一个 PdfPageBase 变量        PdfPageBase page;         //循环遍历页面        for (int i = 0; i < doc.getPages().getCount(); i++) {             //获取指定页面            page = doc.getPages().get(i);            if (page != null) {                 if(page.getImagesInfo() != null){                     //循环遍历页面中的图像                    for (PdfImageInfo info: page.getImagesInfo()) {                         //使用tryCompressImage方法压缩高分辨率图像                        page.tryCompressImage(info.getIndex());                    }                }            }        }         //保存文件        doc.saveToFile("压缩高分辨率图像.pdf");    }}
复制代码

效果图

——本文完——

发布于: 刚刚阅读数: 5
用户头像

还未添加个人签名 2022-06-02 加入

还未添加个人简介

评论

发布
暂无评论
如何通过Java代码压缩PDF文档?_Java_在下毛毛雨_InfoQ写作社区