僕は、キーボード入力が苦手です。とにかく致命的に遅い。
なので、もう十数年、音声入力ソフトを利用して文字入力をしています。
これまで使ってきた有名どころの音声入力ソフトがこちら。
直近まで僕は、Windows用の音声入力ソフトとして「AmiVoice SP2」を利用してきました。
しかし残念なことに、AmiVoiceは2020年3月末日をもってサポートが終了してしまいました。
加えて、他のWindows用の音声入力ソフトにおいても現在、開発が継続されているものはありません。なので、残念ながら「今後も継続して利用できる保証はない」というのが現状です。
下手したら、音声入力ソフト難民もありえる…。
とそんな中、最近教えてもらった音声入力ソフトSokki Voiceが、非常に有能だったので最近よく利用しています。
ということで、以下ではSokki Voiceという音声入力ソフトを使った感想などを、これまで使用してきたソフトと比較して書いてみようと思います。
目次
Googleの音声入力が無料ながら優秀過ぎたのではないか
過去定番だった音声入力ソフトが開発終了した要因の1つとして「Google音声入力」の台頭はあるかと思います。
というのもGoogleの音声入力は、無料でありながら非常に高精度の音声入力ができるからです。
実際Google音声入力は、Googleドキュメント等にて無料で利用することができます。
Googleドキュメントでの音声入力例。
Googleドキュメントにユーザー登録さえしてあれば、誰でも手軽に利用が可能です。
Google系のサービスで利用する分には、かなり便利です。
Google音声入力の利点
Googleの音声入力の利点はこちら。
- Googleが開発していると言う安心感
- Googleなので今後も開発が継続されるであろうこと
- 事前準備がほぼ不要(声の事前学習など)
- 無料から利用できる(能力を手軽に試せる)
- 認識率も高い(これまでの音声入力ソフトメーカーに引けを取らない)
無料(安価)かつ手軽に利用できて、認識率も高ければ、こちらを利用する人も増えるでしょう。
そしてそうなれば、徐々に「それまで定番だった音声入力ソフトメーカー」の利用者も減り、利益率も下がり、採算も合わなくなり、開発中止になるのもしょうがないのではなかろうか。
ならばGoogle音声入力を使えばいいのでは?
ということで、僕も「Google音声入力を使ってみよう!」と、一時期検討したこともありました。
具体的には以下のツールや有料アプリを検討したこともありました。
- Googleドキュメント(無料)
- Voice Rep 3
- Voice Rep 3 Pro
- Voice Code
- VoiceIn(Chrome拡張)
ただ、これらのソフトは僕が使った限りでは、概ね以下のような難点がありました。
- Windowsの任意のアプリに直接入力できない
- 音声入力で句読点を入力できない・しづらい(一部できるものもある)
- キーワード登録(単語登録)辞書を作成できない
上記のような
AmiVoice等にはデフォルトである機能がない…
という理由で、残念ながら普段使いするまでには至りませんでした。
僕が使ってみた「Google系音声入力ソフトの特徴」を簡単にまとめたものがこちら。
ソフト名称 | 入力対象 | 概要 |
Googleドキュメント | Googleドキュメント | Googleドキュメント用の音声入力。Googleアカウントを持っていれば無料で利用できる。ただし、Googleドキュメント上でしか利用できない。 |
Voice Rep 3 | 専用のエディタ | 簡易版のワープロ機能あり。句読点自動追加機能はあり。 |
Voice Rep 3 Pro | 専用のエディタ | Voice Rep 3 の上位ソフト。音声ファイルから書き起こしもできるけど使用感は上記とほぼ同じ。 |
Voice Code | 専用のエディタ | 専用エディタからWindows任意のアプリに貼り付けはできるけど、直接入力はできない。句読点自動追加機能はあり。 |
VoiceIn | Google Chrome | Google Chrome の拡張機能。無料版(試用版)だと辞書登録を試せない。しかも料金は1年ごとのサブスクリプション形式。 |
僕の場合、Windowsアプリに直接ザクザク音声入力したいタイプなので、この機能がないのは利用候補になり得ません。
加えて、僕は句読点を声に発しながら文章を入力したいので、声で好みの場所に句読点を打てないのも入力リズム的にもキツイ。
あと、よく使用する「キーワード」を登録できないのも、やっぱ不便。毎回そのキーワードを使用するたびに文章を修正しなくてはなりません。
なので、僕は音声入力ソフトを利用するにあたって、以下の機能は是非とも欲しいものでした。
- 任意のアプリに直接入力できる
- 句読点を声で入力できる
- よく使用するキーワード登録ができる
これまでに、上記条件を満たす「Google音声入力ソフト」がなかったため、どうしてもGoogle系の音声入力ソフトは使用する気になりませんでした。
新たなGoogle音声入力ソフトを知る
しかし先日、Voice Codeのレビューを書いた時に、みちさんという方がフォーラムで「話してパソコン入力 via the Web(愛称:Sokki Voice)」と言うGoogle音声入力ソフトを紹介して下さいました。
実際に紹介頂いた「Sokki Voice」を使用してみました。
そして、「他のGoogle系音声入力ソフトにはない使い勝手のよさ」に痺れました。
とにかくこのSokki Voiceという音声入力ソフトには、自分の欲しいと思っていた機能が完備されていたので。
当然、先ほど挙げた以下のような機能も標準装備です。
- 任意のアプリに直接入力できる
- 句読点を声で入力できる
- よく使用するキーワード登録ができる
その他にも、今までのGoogle系音声入力ソフトにはなかった「かゆいところに手が届く機能」も多々あり素晴らしかった。
ということで、
Sokki VoiceはAmiVoiceの代替ソフトにもなり得るかも!
ということで、連日使ってみることにしました(後にみちさんが開発者ということを知ります)。
Sokki Voiceとは
Sokki Voiceとは、Windows 10、Windows 11にも対応した、Google音声認識エンジンを利用した音声入力ソフトです(僕の環境ではWindows 8.1でも利用できています)。
こんな感じのインターフェース。
Sokki Voiceを利用するには、Google Chromeを使用する必要があります。
Chromeから音声認識エンジンのWeb Speech APIを介して音声が文字に変換され出力されます。
起動時に出る小ウインドウの「マイクボタン」を押すことで音声入力を開始することができます。
このSokki Voice利用する前は、1度Web APIを経由するので使用以前は「レスポンスが遅いんじゃないの?」と思っていました。
しかし、レスポンスもクライアントソフトのAmiVoiceとほぼ変わらないくらい早いです(若干AmiVoiceが早い)。
そして、このSokki Voiceの一番の特徴は、やはり「Windows上の任意アプリに直接音声入力できる」ということだと思います(一部環境除く)。
このソフトが登場するまで、Windowsアプリに直接入力できるGoogle系音声入力ソフトは僕の知る限りありませんでした。
Microsoftの音声入力も使えるが
Sokki Voiceは、Microsoftの音声入力エンジンも使用できます。ただ、個人的にGoogleの方が優秀だと思っているので使っていません。なので以降はMicrosoftエンジンには特に触れません。
MicrosoftとGoogleの音声認識エンジンの違いについては作者さんが詳しく説明しておられるので、以下をご参照ください。
Sokki Voiceの素晴らしい点
実際にもう、3ヶ月以上使ってみて感じたSokki Voiceの素晴らしい点を、以下に思いつく限り挙げてみます。
- 任意のアプリに直接入力できる
- 句読点を声で入力できる
- キーワード登録ができる
- 発声後に変換も可能(※IMEを使用)
- 音声入力も早い
- 認識精度も高い
- 環境音が多少あっても誤入力しづらい
- 長時間放置すると自動で音声入力がオフになる
- 英語の音声入力に対応している
- 音声コマンド登録もできる
- 事前準備は不要
- 30日間試用できる
- 値段も安い
以下では、ひとつずつ詳しく説明します。
任意のアプリに直接入力できる
Sokki Voiceは、これまでのGoogle系音声入力ソフトにはなかった「Windowsアプリへの直接入力」が可能な音声入力ソフトです。
Googleの音声入力機能が素晴らしいのは知ってはいたのですが、これまで僕は「アプリへの直接入力機能」がなかったために使用を断念していました。
しかし僕の知る限りSokki Voiceは、Google音声認識を利用しながらも、それが唯一可能なソフトだったんです。
例えば以下のように、Windowsのメモ帳のカーソル位置へ直接音声入力が可能です。
もちろんExcelにも入力可能です。
※僕は古いExcelを使用しているので、最新版では試してません。
ワードパッド入力も問題なし。
もちろん、Windows製以外のアプリにも直接入力可能です。
やっぱり音声入力をするのに、直接入力できるのとできないのでは使い勝手が全然違います。
他のGoogle系音声入力ソフトで、独自エディタに入力できるものはあるのですが、やはり別アプリに貼り付ける際は、ひと手間かかって面倒くさい。
けれど、Sokki Voiceの場合は、指定アプリに直接文字が入力されていくので、ほんと楽。
僕も大昔に、Windowsアプリを作っていたことがあるんですが、外部アプリを制御するのってかなり大変だった記憶があります。だから、他アプリに対して文字をこんなに綺麗に送れているだけでも、ほんと感動しました。
句読点を声で入力できる(記号入力もほぼ対応)
あと、「。(句点)」や「、(読点)」を自分のタイミングに合わせて音で入力できるのもSokki Voiceの大きな特徴かと思います。
Sokki Voiceは、句読点以外にも以下のようにデフォルトで「音声入力が可能な記号」が60種類以上登録されています。
「括弧」や「?」、「!」などよく利用するものはデフォルトで登録されています。
その他に、「てにをは」のような平仮名の助詞から入力開始できるように、独自の変換リストもデフォルトであります。
上記のように助詞から入力できるようになっていると、変なところで文章を切ってしまった場合でも、キーボード入力が不要で音声入力を再開できます。
ですので、
文字も句読点も記号も全部声でザクザク入力していきたい!
なんて方には、非常に親和性の高いGoogle音声入力ソフトになっていると思います。
キーワード登録ができる
Sokki Voiceはキーワード登録(単語登録)することができます。
ですので、自分専用のキーワード辞書も作成可能です。
作成方法は、「補正テーブルを開く」ボタンを押して、
「補正候補」を入力するだけです。
上記のように自分用の変換候補を増やしていけば、どんどん自分好みの音声入力ソフトに変化していきます。
「補正テーブル」以外に「キーワード」登録でも同様のことができます。
試してみた感じでは、どちらに入力してもいいみたい。
ただ、マニュアルを見る限りでは、こちらは「入力するのが面倒なキーワード」を入力するものという使い分けがされているみたい。
個人的には、どっちを使ってもいいような気がしてて、使い易い方を使えばいいのではないかと思います。
詳しくはマニュアルを参照してください。
発声後に変換も可能(※IME使用)
Sokki Voiceは、IMEを用いて「音声入力後の再変換」も可能です。
IMEを有効にした状態で、音声入力すると以下のようにIME変換前の状態で表示されます(以下は僕が使用しているATOKでの例)。
後は、IMEの変換機能を利用して思い通りの文章に変換することも可能です。
一連の変換動作はこんな感じ。
ただ、どうしてもGoogle音声入力の機能だけで正しく入力できない場合は、IMEをオンにして意図した変換ができるのはありがたいです。
こういった機能も、僕がこれまで利用した他のGoogle系音声入力ソフトには無かったのではないかと。
音声入力も早い
前述しましたが、Sokki Voiceは、入力速度も結構早いです。
Sokki VoiceはWeb Speech APIと言うWEB上のAPIを経由して音声が変換されます。
けれど音声入力スピードは、以前使用していたクライアントソフトのAmiVoiceとそう変わらないくらい早いです。
加えて、Sokki Voiceの場合は、音声入力モードも「標準モード」と「一言モード」を選択可能です。
音声入力モードを「一言モード」にすることで、より入力速度が早くなります。
僕が音声入力をする場合は、文章を短く区切って確認しながら入力していくタイプなので、この「一言モード」入力のサクサクさには、大変重宝しています。
実際の変換速度は、こちらの「音声認識(Web Speech API)デモ」から体験可能です
認識精度も高い
あとSokki Voiceは認識精度もかなり高めです。
これは、Googleの認識エンジン(Web Speech API)が優秀ということでもあるのですが。
体感では、Sokki VoiceもAmiVoiceも認識精度はほとんど変わらないような気がします。
もちろん、それぞれ得意・不得意な文章というのはあります。けれど平均すると認識精度にそこまで差は無いように感じます。
実際の認識精度は、こちらの「音声認識(Web Speech API)デモ」から確認可能です
環境音が多少あっても誤入力しづらい
Sokki Voiceを長時間使用していて素晴らしいなと思ったことは「多少周りの音がうるさくても問題なく音声入力できる」ということです。
僕がこれまで使用してきた「クライアントサイドの音声入力ソフト」だと、テレビの音声をつけながらの音声入力は不可能でした。
というのも、「テレビ音」と「自分が発する声」が混ざりあって誤入力が頻発するからです。
けれど、Sokki Voice(Google音声入力)だと、多少テレビの音があろうと、高い精度で音声入力ができます。
これは、Googleの音声認識エンジンが優秀で、余計な環境音を排除して、声だけを綺麗に抽出しているのだと推測できます。
もちろん、テレビを大音量にすると認識精度は落ちますが、BGM程度に流しているテレビ音くらいなら、僕の環境であれば問題なく音声入力できます。
長時間放置すると自動で音声変換機能がオフになる
あと、Sokki Voiceで個人的にポイントが高かったのが「音声入力を有効にしたまま放置していると勝手にオフにしてくれる機能」です。
僕の場合、音声入力ソフトを使用していると「音声入力を切り忘れる(無効にし忘れる)」ということが多々あります。
音声入力を切り忘れた状態で、家族と会話してしまうと「エディタ上が文字で埋め尽くされてえらいことになってしまう」なんてことも結構ありました。
けれどSokki Voiceは、音声入力機能が有効なままで何も入力せず放置すると、20分で音声入力を自動的にオフにしてくれます。
これもちょっとした機能ではありますが、僕のような「音声入力オフ」を忘れがちな自分にとっては、ありがたすぎる機能です。
これで無駄な後処理に迫られることは、ほぼなくなりました。
追記
初期のSokki Voiceでは、20分間放置すると音声入力がオフになるという仕様でした。v3.0.1以降では20分、10分、5分、1分、30秒の中から選択できるようになりました。
これにより、自分の使用状況に合わせて自動停止機能が利用出来るようになりました。
英語の音声入力に対応している
Sokki Voiceは、モード切替で英語の音声入力にも対応しています。
日本語の音声入力ソフトで「英語音声入力機能」がついているソフトはほぼないので、これもかなり嬉しい(僕の知っている限りVoice Rep 3 Proぐらいしか英語認識機能はついてない)。
音声入力ソフトで、日本語の音声入力ができるようになると、今度は英語入力が面倒くさくなってくるんですよね…。
そういう時は、日本語も英語も対応できるソフトはありがたい限り。
こんな感じで、言語が切り替えられるので
英語を選択した状態で音声認識をオンにすれば利用できます。
僕の下手くそな英語の発音でも、結構高精度で認識してくれるのがありがたい。やっぱ、Google音声認識エンジンの能力は素晴らしい。
音声コマンド登録もできる
僕はあまりこの機能は使用していないのですが、Sokki Voiceは「音声コマンド機能」を利用して、「声でアプリを起動」などを行うことも可能です。
例えば、「声でWindowsのメモ帳を起動する」とかであれば「音声コマンド」の「編集」から
以下のようにファイルパスを入力して「音声コマンド登録」を行うことで可能です(%Windir%のような環境変数はv2.1.1の時点では使えないようです)。
URLを入力すれば、声で利用頻度の高いサイトを既定のブラウザで開く設定にもすることが可能です。
音声でアプリ起動も操作したい
なんて需要がある方には便利かと。
例えば、「手足が不自由で出来るだけ声で操作したい」という方にも重宝する機能かと思います。
事前準備は不要
少し前の音声入力ソフトだと、ソフトをインストール後、結構長めの文章を読んで自分の声の特徴をパソコンに学習させる必要がありました。
最近の音声入力ソフトだと、即座に使えるものも多いですが、当然Sokki Voiceもインストール後すぐに使えます。
特に複雑な設定も必要ないので、誰にでも簡単に使い始められると思います。
30日間試用できる
このSokki Voiceは試用版として、30日間全ての機能を無料で試すことができます。
ソフトが気に入れば、購入手続きをしてアクティベートコードを入手 → 入力すればそのまま継続利用できます。
試用してみて気に入らなければ、そのまま放置しておけばソフトが使えなくなるだけで、支払いが発生することもありません。
なので「音声入力ソフト」に興味がある方は、安心して存分に機能を試せるかと思います。
値段も安い
30日間試用後、気に入って購入する場合でも、値段が2500円(税込)とかなりお手頃です。
僕がAmiVoice SP2を購入した時は、2万円前後したと思うので、それと比較してもかなり安いです。
同じ「Google音声認識エンジン」を利用したVoiceCodeだと2980円(2021年12月時点)。
Voice Repとかでも3300円です(ベクター特価で2640円)。
Google音声認識エンジン系のソフトでSokki Voiceは、最安価格帯ではあると思います。
それでいてSokki Voiceの機能は他を圧倒しているわけで。
かなりお買い得だと思います。
Sokki Voiceの難点
Sokki Voiceの良いところばかり書いても参考にはならないと思うので、AmiVoice等と比較して難点も思いつく限り挙げてみたいと思います。
- キーワード登録(単語登録)にクセがある
- Google Chromeがないと利用できない
- 音声が一旦Googleサーバー上に送信される
- ネットワークに繋がっていないと利用できない
- 制限のあるパソコンでは使えない可能性がある
キーワード登録(単語登録)にクセがある
通常のキーワード登録の場合、以下の組み合わせで単語登録を行います。
- 登録したい単語
- 単語の読みがな(ひらがな)
例えば、AmiVoiceの単語登録だったらこんな感じ。
単語と読み(ひらがな)を登録するだけなのでシンプル。
けれど、Sokki Voiceの単語登録(補正テーブル入力)の場合は、以下のように入力する必要があります。
- 補正前文字(音声入力で出力する単語※単なるひらがなではない)
- 補正後文字(登録したい単語)
一般的な単語登録であれば「単語の読みがな(ひらがな)」で入力すればOKです。
ただSokki Voiceの「補正テーブル入力」の場合は「Sokki Voiceが音声出力する変換したい単語」を入力する必要があり少しややこしいです。
このように、多少単語登録にクセはあります。とはいえ、慣れてしまえば大したことありません。
他のGoogle系音声入力ソフトの場合は、こういった「単語登録(補正テーブル)」機能もない場合がほとんどなので、個人的にはこの機能があるというだけでも十分ありがたいです。
とにかく文章の修正回数が格段に減るので。
この機能があるとないとでは、文章の生産効率が格段に違います。
Google Chromeがないと利用できない
Sokki Voiceは、Google Chromeを経由してWeb Speech APIを利用し音声入力を行います。
なので当然、Chromeがないと利用できません。
とはいえ、Windowsユーザーのブログ書きであれば大抵、Chromeぐらいインストールしている(もしくはインストール出来る)と思うので、これは大した難点ではないような気もします。
音声が一旦Googleサーバー上に送信される
先程も書きましたが、Sokki Voiceは、Google Chromeを経由してWeb Speech APIを利用し音声入力を行います。
なので、自分の発した声が一旦Googleサーバー上で処理されて文字情報として返ってきます。
なので、会社や国・自治体などの機密文書を扱う場合は、一旦内容がGoogleを経由するのでセキュリティー的な問題が出てくるかと思います。
とはいえ、僕のような個人のブログ書きにとっては、知られてまずい情報も特にないので気にせず利用しています。
Google・Amazonのスマートスピーカーも似たようなセキュリティリスクがあるので、それを問題とせずガンガン利用している人は特に気にする必要もないかと思います。
ネットワークに繋がっていないと利用できない
あと、WEB APIを利用する以上、ネットワークが繋がっていないと利用できません。
なので、スタンドアローン環境での使用は無理です。
また、ネットワーク環境が悪い場合は、Chrome~Google間の接続が切れることもあるので、安定した音声入力パフォーマンスを出しにくい環境になり得る可能性もあります。
制限のあるパソコンでは使えない可能性がある
これもネット接続関係のことなんですけど、学校や職場のパソコンを利用している場合、情報保持の観点等で接続が制限されているケースもあるかと思います。
Sokki VoiceはGoogleの音声認識APIと通信をする必要があるので、そういった接続制限のあるパソコンでは正常に利用できない可能性もあります。
また、必要なフレームワークやライブラリが入っていない(インストール制限のある)パソコンでも利用できない可能性もあります。
そういったことも踏まえて、Sokki Voiceも30日間無料試用機能を利用して、必ず事前に動作確認をしておく事をお勧めします。
まとめ
ということで、この記事の96%はSokki Voiceで書きました。
Sokki Voiceの様々な機能を試しながら、ほぼ声で楽しく書くことができました。
もちろん、僕は全ての「Google系音声入力ソフト」の機能を隅から隅まで使って知り尽くしているわけではありません。
けれどSokki Voiceは、僕がこれまで使ったことがある「Google系音声入力ソフト」の中で、ダントツに使いやすいソフトに仕上がっているように感じました。
僕がこれまで常用していた、「AmiVoice(個人向け)」が開発中止となった以上、「今後、使える音声入力ソフトがない…」なんて状態になる可能性もあり得たわけです。
それが、Sokki Voiceの登場により代替ソフトを得ることができました。
この差は大きい。
今後しばらくは、「これまで使用していたAmiVoice」と「新しく知ったSokki Voice」を並行して使いながら慣れていこうと思います。
Sokki Voiceを作ってくださった、みちさんには、このソフト制作はもちろん、フォーラムで教えてくださって、ほんと感謝。
加えて、試用版を使用している最中に滅茶苦茶要望を出したんですけど、そのほとんどを取り入れてもくださいました。
僕のような「古参音声入力ユーザーの面倒くさい要望」にも丁寧に対応してくださり、さらに使いやすくしてくださいました。
ということで、
無料で試せる音声入力ソフトはないだろうか
Googleベースの使い勝手の良い音声入力ソフトが欲しい
なんて場合は、Sokki Voiceは非常に良い選択肢になるかと思います。
30日間は無料で試せるので、購入前は存分に機能を試してみることをおすすめします。
ダウンロード Sokki Voice
※リンク先の名称は「話してパソコン入力 via the Web」になっています。
サイト サークルロード
先程のTwitterでのやり取りはありがとうございました。
改めてお聞きしたい事がございます。私は聴覚障がい者なので、音声入力ソフトで文字起こしする事で健常者との会話を成り立たせています。
そこでスマホ(iPhone)用の音声入力アプリや無線集音マイクでいいものがあればお教えいただければと存じます。
もし専門外であれば不躾な質問をお許しください。何卒よろしくお願い致します。