如何使用 Java 从 PDF 中提取图像



问题描述

如何使用 java 从 PDF 中提取图像。

解决办法

以下程序使用 Java 从 PDF 文件中提取图像。

import java.awt.image.BufferedImage; 
import java.io.File; 

import javax.imageio.ImageIO; 
import org.apache.pdfbox.pdmodel.PDDocument; 
import org.apache.pdfbox.rendering.PDFRenderer;  

public class ExtractImageFromPdf {  
   public static void main(String args[]) throws Exception {  
      
      //Loading an existing PDF document 
      File file = new File("C:/pdfBox/ExtractImage_IP.pdf"); 
      PDDocument document = PDDocument.load(file); 
      
      //Instantiating the PDFRenderer class 
      PDFRenderer renderer = new PDFRenderer(document);  
      
      //Rendering an image from the PDF document 
      BufferedImage image = renderer.renderImage(0);  
      
      //Writing the image to a file 
      ImageIO.write(image, "JPEG", new File("C:/pdfBox/ExtractImage_OP.png")); 
      System.out.println("Image created"); 

      //Closing the document 
      document.close();  
   } 
}

输入

Extract Input

输出

Extract Output
java_apache_pdf_box
广告