規則音声合成エンジン AquesTalkシリーズ
組み込み用に開発された小型軽量のエンジンで、テキスト情報(音声記号列)をリアルタイムに音声に変換して出力します。 これまで数百万台の機器に実装されています。現在、AquesTalk10/AquesTalk pico/AquesTalk2/AquesTalk1の4種類のエンジンがあります。 それぞれ音声生成アルゴリズムが違うため、声質が異なります。声質や動作に必要なリソース量を考慮してエンジンを選択します。
エンジン種類
- AquesTalk pico
- シリーズ中、最小サイズのエンジンです。RAM500byte、ROM30Kbyte、8bit CPUという比類ない極小リソースでリアルタイムの音声合成ができます。リソース制約の厳しい小型の組み込み機器に適しています。 このエンジンを1チップマイコンに組み込んだ音声合成LSI AquesTalk pico LSI も販売しています。
- AquesTalk10
- 32bitシステムへの組み込みに最適な最新の音声合成エンジンです。AquesTalk,AquesTalk2の後継として、両エンジンの特徴を維持したまま、クリアな声質、高い明瞭性、パラメータで声質を調整可能などの特徴を持っています。
- AquesTalk2
- 声の種類を規定する16KB程度のデータを差し換えることで、動的に14種の中から声種を切り替えられる特長を持っています。
- AquesTalk1 (旧AquesTalk)
- 声の種類は1つに固定されていて基本は女声ですが、別途8種類の中から選択もできます。16bit CPUから動作します。
エンジン仕様
エンジン名 | AquesTalk pico | AquesTalk10 | AquesTalk2 | AquesTalk1 |
処理量・CPU | 4MIPS 8bit~ | 20DMIPS 32bit~ | 10MIPS 16bit~ | 10MIPS 16bit~ |
RAM | 0.5KB | 11KB | 5KB | 8KB |
ROM | 23KB | 134KB | 51KB | 100KB |
入力テキスト | ローマ字表記音声記号列* | かな表記音声記号列* | ||
音声出力 | 8/10KHzサンプリング, 16bitPCM | 16KHzサンプリング, 16bitPCM | 8KHzサンプリング, 16bitPCM | |
インターフェース | C関数呼び出し | |||
声種 | 7種から選択 | 3種 + ユーザ調整可 | 14種 | 8種から選択 |
オプションモジュール
AquesTalkライブラリに下記のモジュールを追加可能です。
他にも、入出力フォーマットの変更など柔軟にカスタマイズ対応いたします。
「人名モジュール」AqJinmei
カナ表記の人名を入力とし、適切なアクセントを付与した音声記号列を生成する、AquesTalkエンジンのフロントエンドモジュールです。これを使用すれば、よみがなの情報から適切なアクセントで名前を読み上げることができるようになります。 辞書を持たずに内部ルールでアクセントを付与するアルゴリズムにより、8kbyte程度のコンパクトな実装サイズとなっています。アクセント正解率 姓:95% 名:98% (当社コーパスによる調査)
「地名モジュール」AqDress
地名の音声記号列を生成する、AquesTalkエンジンのフロントエンドモジュールです。郵便番号または全国地方公共団体コードを入力すると、市区町村までの地名の音声記号列を生成します。本モジュールにより、住所を音声で確認するシステムが簡単に構築できます。漢字からの読み上げで問題となる同一表記で読みが異なる地名(例えば、愛知郡: あいちぐん[愛知県]/えちぐん[滋賀県])でも、正しい読みと適切なアクセントで読みあげることができます。プログラムサイズ(データ含む)は、地方公共団体コードからは26KB、郵便番号からは41KB程度と小さく、小型端末にもお使いいただけます。
「周波数変換モジュール」AqResample
組み込みシステム向けのサンプリング周波数変換ライブラリです。 オーディオ等の一次元信号を任意のサンプリング周波数に変換(リサンプリング)します。AquesTalkの出力だけでなく、他のアプリでもお使いいただけます。