PDF

【英】Portable Document Format

 

電子文書及び電子化文書のファイル形式の一つ。

米国Adobe Systems(アドビ システムズ)社が開発したファイル形式であり、プリンタなどの出力機の違いに関わらず、同じ出力を可能とするPostScriptというページ記述言語がベースとなっている。無料で配布されているAcrobat Readerがあれば、Windowsパソコンだけでなく、MACやUNIXなどでも正確に表示/出力ができる。

PDFの特徴

  • フォントを埋め込むことが可能であり、読む側の環境にかかわらず、元の文書と同じフォントが再現できる。(フォントを埋め込んでいない場合には、代替フォントが用いられるため、レイアウト等が変化する可能性がある。)
  • 元のデータを作成したアプリケーションを必要とせずに、閲覧が可能である。
  • データサイズが小さい。画像や文書を適当な圧縮方法を選択して圧縮するため、コンパクトなファイルサイズとなる。(内容によっては、大きいサイズとなる場合もあり、確認は必要。)
  • 変更の履歴を保持させることができる。また電子署名や編集制限などのセキュリティ機能も備えている。
  • 複数枚の文書を束ねることが可能であり、文字の検索も可能である。画像として取り込んだ文書に対してもOCRを適用し、透明テキストとして埋め込むことが可能。(Hidden Text)

 

アドビシステムズ社はPDFの標準化を目的として、ISOに対してPDF規格の策定権を譲渡した。これにより2008年7月に国際規格にISO 3200-1として承認された。これはPDF Part1とも呼ばれ、PDF/X、PDF/A、PDF/Eを含むものである。従来のPDFの仕様(PDF reference Ver1.7)そのままであり、文書が全てPDFに含まれているので原本性が保証される。
またISO 32000 -2の標準化活動も2009年5月に始まっている。こちらはXMLを基準としたもので、PDFファイルから外部データを参照できることを特長としている。そのため、動画や音声など文書以外のデータを取り扱うことが可能となるが、外部を参照するのでPart1のような原本性は保証されない。文章の原本性を保証するにはPart1の仕様に基づき、PDFを作成し、電子署名タイムスタンプを付すことが求められる。逆に、電子署名の失効情報を外部ファイルとして持つことが可能となるため、ECMシステムの効率を上げることが可能となる。


その他PDFをベースとした規格化がISOで進められている。

  • PDF/A … 長期保存用の規定であり、PDF1.4をベースにしている。ISO 19005-1で規定。長期保存に対する見読性を維持する目的で、フォントおよびメタデータの埋め込みが規定されている。
  • PDF/E … 技術情報交換用。ISO 24517-1で規定。
  • PDF/X … 印刷を目的としたPDFのガイドラインで、ISO 15930で規定。PDF/X-1aによって、フォントの埋め込み、画像の埋め込み、CMYKおよび特色へのカラースペースの変換、ICCプロファイルの埋め込みの有無選択、トラッピングの有無確認が可能になっている。

注)ICCプロファイル:色に関わる入出力機器や色空間を特徴付ける一連のデータ

 

大量の書類をスキャナで電子化

大量の紙文書を高速で電子化
業務や用途に合わせて選べる
業務用イメージスキャナ
fiシリーズ

www.pfu.fujitsu.com/imaging/