PDFBox サンプルプログラム

目次

PDFからJPEGファイルを抽出する


try {
    
    //PDFドキュメントをロード
    PDDocument document = PDDocument.load("hogehoge.pdf");
    
    //ページのリストから最初の1ページを取得する
    PDPage page = (PDPage) document.getDocumentCatalog().getAllPages().get(0);
    
    //ページからリソースを取得し、全てのイメージを取得する。
    PDResources resources = page.getResources();
    Map images = resources.getImages();
    if (images != null) {
        Iterator> ite = images.entrySet().iterator();
        while (ite.hasNext()) {
            PDXObjectImage image = ite.next().getValue();
            //取得したイメージをファイルに出力
            image.write2file(System.currentTimeMillis() + "hogehoge");
        }
    }
    document.close();
} catch (IOException e) {
    e.printStackTrace();
}