概要

出版物を合成音声で読み上げる機能は、人間によるナレーションも提供されるかどうかに関係なく、多くのユーザーが頼りにする重要なアクセシビリティ機能です（たとえば、多くのユーザーは、TTSエンジンによる高速再生を好みます）。

リーディングシステムに音声読み上げ（TTS）機能が含まれているか、または支援技術による音声読み上げが可能であれば、基本的な再生は可能ですが、使用されている語彙が複雑だと、通常、強化されていない合成音声エンジンでは発音を間違ってしまう場合があります。

コンテンツ製作者によってTTS再生の質を向上できる三つの技術があります。

PLS発音辞書（Pronunciation Lexicons）: 発音辞書仕様（Pronunciation Lexicon Specification）で、国際的に使用できる発音をXML形式で定義できます。定義されたエントリーに一致する単語が文章内に見つかると、エンジンのデフォルトのレンダリングの代わりに定義された発音が使用されます。この辞書で、文脈によって意味が変化しない単語の発音を簡単に定義できます。
SSMLマークアップ: 合成音声マークアップ言語（Synthetic Speech Markup Language / SSML）を使用して、発音をマークアップに直接埋め込めます。要素にSSML属性が検出されると、エンジンのデフォルトのレンダリングやPLSエントリーの代わりに提供された発音が使用されます。SSMLですべての発音を定義することもできますが、PLS辞書の補足として使用する方が適しています（異音語や曖昧な数値形式を明確にするなど）。
CSS Speech（音声）プロパティ: CSS speechモジュールには、音声再生を制御できるさまざまなプロパティが含まれています。単語や数字を一文字ずつ読み上げる制御から音声キューや一時停止の挿入まで、これらのプロパティを使用すると、従来の発音の強化を超えて、再生を制御できます。

ただし、これらの技術はいずれもリーディングシステムではサポートされていません。W3C Web Accessibility Initiative（WAI）には現在、発音タスクフォース（Pronounciation task force）があり、これらの技術のサポートについての問題を検討しています。発音タスクフォースの作業から新しい方向性が出てくれば、このページは更新されます。

サンプル

拡張TTS機能を実装した出版物がEPUBサンプルプロジェクトにあります：

Georgia

サンプル

関連リンク