先日、とある資格試験のためのテキストをPDFを読んでいたら、気がつきました。
それは「AcrobatでPDFの読み上げ機能を使うと、読み上げ順がおかしい」というものです。
私はこの資格のテキストに関して、音声で聞くことを数年やってきたのですが、そのときは編集・校正を行っていたので、元原稿の時点で音声で聞いていました。現在、私はこの編集・校正は行っていないので、できあがったPDFで内容を聞くことになったのですが、とにかく読み上げ順がおかしくて音声で聞くのは難しいという判断になりました。残念です。
(対処方法としてPDFからテキストを別アプリにコピペして音声で読み上げてもらっていますが…)
元のデータはInDesignで作成されていて、極めて普通のデータのはずなのに、なぜこうなってしまったのか。
原因を探ると、ちょっとした設定の違いで、読み上げ順が変化することがわかりました。
今回はその設定について紹介します。
InDesignからPDF/X-4で書き出す
以下のようなドキュメントをInDesign 2021で作成して、PDFを作成するテストをしてみます。※内容は私のブログ記事です
PDFの書き出しは「PDF/X-4」のデフォルトで書き出してみます。
書き出されたPDFはこちらです。
AcrobatでPDFを読み上げる
書き出されたPDFをAcrobatで読み上げてみましょう。
メニューから「読み上げ」→「読み上げを起動」とした後に、再度メニューから「読み上げ」→「このページのみを読み上げる」を選択します。
読み上げてみるとおかしな部分がいくつかありますね。
- タイトル部分が2回読まれる
- Adobe CCが「アドベック」と読まれ「AdobeCC」と認識されている
- 左の段落から右の段落に続けて読み上げるときに、連続で読み上げられず、一度読み上げが切れる
どうしてこうなってしまうのでしょうか。
Acrobatのアクセシビリティの機能で確認してみる
調べてみると、PDFの読み上げの順序は「アクセシビリティ」の機能にある「自動タグ文書」機能で読み上げの順序を決めているようです。
これを実行した後に「アクセシビリティ」の機能の「読み上げ順序」を見てみると、AcrobatがPDFをどのように認識しているかがわかります。
すると、以下のように見出しの段落の装飾が「図形」(Fig)として認識されていたり、右の段落の最初の段落が「段落」ではなく「インライン要素」として認識されていたりと、ちょっとおかしいデータになっています。
これがPDFの読み上げに悪い影響を与えているようです。
読み上げ順序の解決方法は「タグ付きPDFを作成」
アクセシビリティで読み上げは重要な項目のひとつです。
その問題を解決する方法がPDFに書き出す(保存・変換する)ときに、「タグ付きPDFを作成」にチェックを付けて書き出すことです。
それでは、タグ付きPDFとは何なのでしょうか。
タグ付きPDFについて、アンテナハウスさんのページに詳しい解説がありました。
タグ付きPDFとはなにか
文書の各部分に、部・章、見出し、引用、箇条書き、表などの構成上・意味上の役割を与えることを文書の構造化という。文書の構造化により、読み手が意味をより理解し易くなる。タグ付きPDFは、内部に文書構造を指定するタグを付与したPDFのことである。タグ付きPDFでは、PDFの中でテキストや画像などのコンテンツをマークで囲い、マークにタグを付与する。また、文書の階層や表などの構造を表すタグを定めて、構造を表すタグとコンテンツを表すタグを使ってタグのツリー構造(タグツリー)を作成する。
タグ付きPDFとはどんなもの | アンテナハウス PDF資料室
つまり、見た目ではなく、特定のルールに従い文書構造を指定したPDFということになります。
それでは「タグ付きPDFを作成」にチェックをつけてPDFを書き出してみましょう。
PDF書き出しの設定で「タグ付きPDFを作成」にチェックを入れます。
書き出されたPDFはこちらです。
タグ付きPDFを作成にチェックをつけたPDF/X-4設定で書き出したPDF
AcrobatでPDFを確認してみると、見出しの段落は見出し(H1・H2)として認識されており、右上の段落も正常に認識されているようです。
※見出しの段落はInDesignの段落スタイルの「タグを書き出し」で設定しています。
AcrobatでこのPDFを読み上げてみます。
- タイトル部分が1回読まれるだけ(正常な読み方)
- Adobe CCは「アドビ シーシー」と読まれる(正常な読み方)
- 左の段落から右の段落に続けて読み上げるときに、連続で読み上げられる(正常な読み方)
問題は解決したようですね。
実際は画像の読み上げがページ全部を読み上げた後に読み上げられるようになってしまい、別の問題が発生しました。(InDesignのデータ上はアンカー付き画像)アーティクルの設定などで読みの順序は設定できるはずですが、ちょっとなぁ……。
また、読み上げとは別の項目になりますが、タグ付きPDFにすることで、テキストをコピーするときに見た目の改行ではなく、段落を活かした改行でコピーすることができます。
PDFのテキストをコピーするときに改行だらけにならず、再利用しやすくとても便利です!
掲載しているPDFのテキストをコピーして別のアプリに貼り付けてみるとわかります。試してみてください。
このように、ほんの少しだけ気を遣うことで、より多くの人が使いやすいPDFを作ることができます。
PDFで電子出版をされている方は、ぜひ試してみてくださいね!
※作成されたPDFを販売サイトなどで著作権用の処理している(=サーバー上で透かしや文字入れなどの処理を行っている)場合に、タグ付きPDFの中のタグが残るかどうかまでは検証できないので、その点はご容赦ください
※タグ付きPDFにしておくとスマホ向けのLiquid ModeのPDF表示にも有効かもしれませんね
関連情報・参考資料
- アクセシビリティに対応した PDF の作成(Adobe)