プログラミングとデザイン、スタートアップの話

プログラミングやデザイン、スタートアップ関連についての雑記

" ); });

音声入力のみでブログを書いてみた。macでの音声入力はブロガーにオススメできる。

この記事は音声入力で書いています 。 ブログの記事を全て音声入力でかけることによってパソコンだけではなくスマートフォンでも記事が書けるようになるので非常に楽だなと思いチャレンジ中です 。 下記の記事でも書いたように、ブログをたくさんの人に読んでもらうためにはブログの記事数がKPIになっているため、いかに楽して質の高いブログの記事をたくさんかけるかを日々探しています。 その目的を達成するための検討中の手法が音声入力です。

harv-tech.hatenablog.com

ちなみに今回の記事は、Macに搭載されている音声入力のシステムを使って書いています。 今のところ3文書いていますが、変換ミスもなく全てスムーズに行っています。 過去にもいちどブログの記事を音声入力のみで書こうと思ったことがあったので、音声入力で記事を書くことのメリットやデメリットを紹介していきます。

今回の記事はすべて音声入力で書くので、5時脱字が発生していたとしても基本的にはそのままで書きます。 と、言ってるそばから5時が発生してしまいましたね。 誤った文字のほうの5時は無理そうですね。あまりにひどい誤字だと理解できなくなってしまうので、その場合は誤字の後ろに()で正しい文字を書いています。

Macの音声入力は精度・スピードが高い

音声入力のやり方としてMac標準の音声入力システムを使うかもしくはGoogle ドキュメントとかを使ってGoogleの音声入力システムを使うか何桃李花(何通りか)のやり方が存在します。結論としてはGoogleの音声入力よりもMacのそれの方が 、制度やスピードが高く使いやすいと感じます。

Googleの音声入力よりも変換速度が速い

Googleの音声入力の変換よりも圧倒的にマックの変換のほうが早いです。ほとんど待ち時間を感じないです 。Googleの場合1行離して音声入力完了した処理を行ったら体感速度で1秒から2秒ほど変換まだないといけません。 ですがMacの場合は入力が完了してからの変換までの時間が0.5秒ほどで完成するイメージです。

Google位のスピードだと音声入力でブログの記事を書くのは相当疲れますがマックのスピードなどほとんど疲れません。自然に喋って入力しているような感覚で記事を書くことができます。

一気に2.5行くらい入力できる

マックの音声入力はエフえのき(Fnキー)を2回連続で押したらスタートします。それからずっとしゃべり続けているとある一定の時間が経った段階で自動的に音声入力のマイクが切れます。 例えば今この文章は一介の音声入力で書いています。普通のしゃべるスピード位で書いていても問題はなく聞き取ってくれています。今既に虹(二行)を書きましたが産業目(三行目)に突入しても 、、、と言う所まで一介の音声入力で書くことができました。

普通のスピードで喋っても問題ない

音声入力と聞くと何となくゆっくりしゃべらないといけないと言うイメージになりますが、マックの音声入力なら普通にしゃべる位のスピードで喋っていたとしても問題なく聞き取ってくれます。 事件としてものすごい平付で喋ってみますが今回はちゃんと聞き取ってくれるでしょうか? ちょっと誤変換が増えましたね。速いスピードで喋ってことによる影響かそれとも速いスピードで喋ったときの私の滑舌が悪いのかどちらでしょう。。。?

もう一度早口で喋って入力してみます。今回はしっかりと聞き取ってくれるのかどうか現在テスト中です。 今回は問題ありませんでしたね。しっかりと滑舌をよく喋るようなイメージでしゃべったので入力ができたのかもしれません。つまり閉鎖(速さ)がある程度早くてもはっきりと喋って滑舌に問題がなければ入力は大丈夫と言うことになります。

滑舌が悪い人には難しい

音声入力は滑舌が悪い人の場合はなかなか難しい入力方法ですね。アメトーク等のバラエティー番組で滑舌の悪い芸人が音声入力にチャレンジしていたようになかなか聞き取ってもらえないかもしれません。 それでも、アメトークで音声入力をやっていたよりもはるかにマックの音声入力の精度は高いように感じるので、滑舌に自信がない人でもいちどチャレンジしてみる価値はあると思います。 おそらくアメトークで使っていた音声入力の時視点(システム)がGoogleの物だったので精度が負ける踊っているのかも知れませんね。

人がいないところでしか書けない

音声入力のデメリットとして人がいるところで入力するのは恥ずかしいと言うデメリットがあります。例えば職場やカフェでは音声入力はなかなかできないですよね。急にあなたがしゃべりだしたらまりな人がもちろんびっくりするでしょう。

音声入力の場合は「改行」という言葉や「。」と言う言葉も、実際に言葉にして言う必要があります。なのであなたがと改行!改行!連呼していたり、まる!まる!まる!と連呼していたりすると明らかに変な人だと思われます。

また自宅で作業する際も家族の方がいる場合は音声入力を使うのはためらわれるかもしれません。なぜなら、ブログに書いてるような内容が全て奥さんや子供に聞かれてしまうのはなかなか恥ずかしい場合があるからです。 子供がもし家にいる場合に音声入力をしていたら、「お父さんなんで1人でしゃべってるの?」と不思議な目で見られることは間違いないでしょう。そんなお父さんを見て砂田(育った)子供はどんな子供になるのか想像がつきませんね。

入力した後に文章を毎回チェックする必要がある

タイピングで文字を入力するときにはブラインドタッチができる場合、文字を打ちながら入力が正しくされているか目で確認することができます。 一方、音声入力の場合はリアルタイムで文字が打たれていかないため一旦喋り切った後に入力完了の処理を行い(エフエヌボタンを押して音声入力を終了する)、一気に変換された文章を目でチェックする必要があります。 これは慣れたら問題ないのかもしれませんが、やはりタイピング慣れている人の場合はちょっと最初面倒に感じる可能性がありますよね。

音楽を聴きながら出来ない

音声入力をする場合には、出来る限り回りが静かな方が正確な聞き取りができます。なのでスピーカーで音楽を流していながら入力する事はあまり良くないと思います。 またマックの音声入力を使ってテキスト入力している場合、Macから流れている音楽は入力の際に提示(停止)されます。

したがって、 音声入力を使ったテキスト入力をする場合には基本的には音楽を流して作業することができないのでその点を考慮する必要があります。 まぁ、この点に関してはあまり問題では無い気もしますね。

肩や腕は全く疲れない

さて、ここまでおよそ3,000文字の文字入力をしましたが一切肩や腕は疲れていません。 めちゃくちゃ楽です。口が疲れるかと言われれば、3,000文字程度喋るのは通常の会話量から考えると全くもって疲れる範囲に入らないです。 この記事を上から読んでいる人はわかるかもしれませんが5時の回数もあまり多くはないため実際に過程で犯すこと(手を動かすこと)もどんどん(ほとんど)ないです。 パソコンでたくさん文字を使ったら肩こりになっている人は肩こりとバイバイできます。

手を使ってタイピングをするのは、音声入力を開始するときのエフエヌティーをにかい打つときと、音声入力を終わらせる時のエフエヌティーを1回押すとき、この2つがメインとなっています 。後はたまに改行を口で言うのは面倒臭いのでインター着(エンターキー)だけ手で売ってしまう時もあります。

ただ、もしかしたらお気づきかもしれませんが、この辺なってきて口がちょっと疲れてきたのか誤変換が増えてきました。おそらく自分のしゃべる滑舌が適当になってきてしまっているのだと思います。 とは言え、誤変換があった場合にそれを手で修正することを加味したとしても、口でしゃべった方が体にかかる負担は圧倒的に少ないと言うに感じます。 なので、一人暮らしをしている方のような周りに誰もいない環境がある人には、かなりオススメの入力方法だと言えると思います。

喋るので、脳に良い

1日中1人で作業してるようなブロガーの方だったりすると、あまり人と喋る機会がいちにちの中で取れないといった問題があるかと思います。 音声入力を使えば普通に人と喋るようなスピードでしゃべるため脳が活性化されるきっかけを作ることができます。

実際今日私は自宅での作業行っているためお昼ご飯を食べた時以外は人と喋っていないのですが、この音声入力を通じて頭がすごいクリアになっていくようなイメージがあります。 話す、喋るという事は非常に頭によくタイピングよりも脳への刺激が多いような気がします。

寝ながらでもできる

今私はパソコンの前に座って音声入力をしていますが、この程度の誤変換立なのであれば寝ながらパソコンを横に置いて入力する事は全然可能です。 これは非常にありがたいことですね。

ブログの記事を書いたりするときに、記事を書かないといけないんだけどどうしても机に座る元気がないとかテンションが上がらないといった場合にもこれならベッドやソファーで寝転びながら記事を書くことができます。 しかも入力速度も実際に文字を手で打つよりも早いので1記事あたりの生産効率が上がると思います。

句読点や改行は全く問題なし

先にも述べましたが、改行や句読点は実際に声に出して指示をする必要があります。「」も実際に口に出して言う必要があります。 最初はまる、まると言うことをには違和感を感じましたが、慣れれば全く違和感がなくなります。このような企業(記号)に対する音声入力も的確に拾ってくれるために全くストレスなくスムーズに入浴(入力)することができています。

この記事を音声で入力してみて

かかった時間

この記事はすべて音声入力で書いていますが、ここまで来るのにおよそ10分から15分ほどしかかかっていません。文字数では4,000文字ほどありますがこれはタイピングするよりも明らかに早いスピードでかけています。

しかもかかった時間が短いことに加えて、疲れを全く感じません。 やはりしゃべると言う事は人間が何前年の前から行ってきたコミニケーション方法なので、それによるストレスはあまりありません。 しかもこの場合、誰かとの対話というわけではないので、一方的にしゃべればオッケーなので通常の会話よりも疲労感はありません。これなら1日に記事、3記事書いてもそれほど疲れないような気がしています。 しゃべるのに飽きてきたら、ちょっとアナウンサーぽくかっこよくしゃべってみたり、抑揚つけてメリハリをつけてみたりするのちょっと楽しくなってきたりもします。

誤字の回数

4,000文字今日の文字量の中で、今回誤変換があったものは20回程度になっています。正しく発音したとしてもどうしても誤変換につながる文字がある事は仕方ないですし、途中でちょっと喋り方 が雑になったために誤変換になったケースもあります。

20回程度の誤変換があれば手作業でそれを成す(直す)事は全然辛くありません。 入力のコツとして、少し発音が複雑の文字であったりとか、噛んでしまいそうな文字が来るタイミングではしゃべるスピードを少しゆっくりするだけで問題は解決できそうな気がしています。

音声入力による誤字って可愛い

音声入力をするときに出てきてしまう誤変換はなんとなくかわいいものが多かったりするので、ちょっとほっこりしたりします。 きちんと誤変換なしで記事を書かないといけないような メディアの場合は無理ですが、一般人が出るようなブログであれば音声入力の誤変換も1つの愛嬌として取り入れる事は可能です。

見出し構成だけタイピングが良い

タイピングと音声入力を比較したときに、タイピングをしているときの方が全体の構成を考えたりすることがやりやすい気がします。喋りながらだとどうしてもしゃべること優先してしまうため、しゃべり言葉に近い形になり構成が少し雑になる可能性があります。 なので、タイピング時にやってる人もいるかもしれませんが、ブログを音声入力で書く場合はまずタイピングで見出し構成を考えてからスタートするのがいいと思います。

見出しを最初に作っておいて記事の構成が完成していれば、それぞれの見出し・段落にあわして後はしゃべればオッケーです。

音声入力ええやん

さて、5,000文字近くの文字量すべて音声入力で書きましたが、この音声入力 を通じて私が感じたこととしては、音声入力いけるやん、と言う感想です。 音声入力システムの精度が高いことによって記事を書くのは非常に楽で、しゃべると言う農園(脳)の刺激もあるし、良いことが多い気がします。また、1記事書き終わった後の疲労感が全く違います。

自宅でしか音声入力はできないと言う制限や、自宅であったとしても誰もいないところじゃないと少し恥ずかしいといったような制限は存在してしまいますが、そういった制限を無視できる環境にいる人であれば、音声入力は 非常に魅力的な方法のうちの1つだと思います。これを機に、今後このブログでは記事を音声入力で書く機会を増やしていきたいと思います。読者の方は、いつまで音声入力 での執筆が続くか楽しみにしておいてください。

あなたにオススメの記事