PDFBox サンプルプログラム
目次
- 空白ページが1ページあるだけのPDFを作成する
- 空白ページが2ページあるだけのPDFを作成する
- ページサイズを指定して空白1ページのPDFを作成する
- BleedBox(塗り足しを含むサイズ),TrimBox(仕上がりサイズ)を指定して1ページのPDFを作成する
- JPEGファイルをPDFに出力する
- JPEGファイルをPDFの複数ページに参照方式で出力する
- JPEGファイルをPDFの複数ページに物理方式に出力する
- PDFからJPEGファイルを抽出する
- PDFからJPEGデータをBufferedImageとして取得する
- PDFに文字列を一つ出力する
- PDFに文字列を二つ出力する
- PDFに日本語を含む文字列を一つ出力する
- PDFから文字列を抽出してテキストファイルへ出力する
- PDFから文字列を抽出して標準出力へ出力する
- PDFから画像の解像度を取得する
- PDFから1ページの画像を取得する
- PDFから全ページの画像を取得する
- PDFファイルを無圧縮で出力してPDFのファイル形式を確認する
PDFからTEXTデータを抽出してテキストファイルへ出力する
try {
//PDFドキュメントをロード
PDDocument document = PDDocument.load("hogehoge.pdf");
//抽出データ出力ファイル
Writer writer = new OutputStreamWriter(new FileOutputStream("hogehoge.txt"));
//テキスト分解クラス生成
PDFTextStripper stripper = new PDFTextStripper();
//抽出&出力実施
stripper.writeText(document, writer);
document.close();
writer.flush();
writer.close();
} catch (IOException e) {
e.printStackTrace();
}