PDFBox サンプルプログラム

目次

PDFからTEXTデータを抽出してテキストファイルへ出力する


try {
    //PDFドキュメントをロード
    PDDocument document = PDDocument.load("hogehoge.pdf");
    //抽出データ出力ファイル
    Writer writer = new OutputStreamWriter(new FileOutputStream("hogehoge.txt"));

    //テキスト分解クラス生成
    PDFTextStripper stripper = new PDFTextStripper();
    //抽出&出力実施
    stripper.writeText(document, writer);
    
    document.close();
    
    writer.flush();
    writer.close();
} catch (IOException e) {
    e.printStackTrace();
}