Vocaloidは、すでに人間に追いついた。

初音ミクが発売されたのは昨年の8月31日、その余りのリアルな歌声に多くの人々が衝撃を感じたものです。しかし、コンピューターソフトが人間に追いつくのはまだ大分先の話だと思っていたのですが、初音ミク発売から一年経たないうちに、音声合成ソフトはあっさり人間に追いついてしまいました。

「ぼかりす」という謎の用語がつけられた初音ミク曲が、ニコニコ動画に投稿されたのが4月末です。この動画のミクの歌声は、それまで神調教と呼ばれていた曲と比べても圧倒的に人間らしいものであり、Vocaloidが使い方によっては、ほぼ人間と遜色ないレベルの生々しさで歌えることを実証した動画でした。


D


最初は正体不明だったこの動画の製作者ですが、さすがネット時代だけあって、あっさり産業技術総合研究所の中野倫靖さんと後藤真孝さんであることが判明しました。

この「ぼかりす」ことVocaListenerという技術は、人間の歌唱データを抽出し、音声合成システムに利用するというもののようです。第75回音楽情報科学研究会での学会発表で、詳細が明らかになったようです。非常に関心が高い技術だったので、ネットでも多数のレポートが上がっています。


そして、この「ぼかりす」動画を見てインスパイアされ、「ぼかりす」に肉薄するリアルな調教を行ったのがyuukissさんです。「【本気MEIKO】 Dearest (pf mix) 【カバー曲】」と題された動画が投下された後は、初音ミクなどのVocaloid2よりも性能が劣るVocaloid1のMeikoを、人間とほとんど変わらないほど生々しく歌わせたということで、話題騒然になりました。この動画では、浜崎あゆみの歌唱が見事にシミュレートされています。


D


さらに今日、yuukissさんは初音ミクバージョンもアップしたのですが、こちらも凄い出来になっており、「ぼかりす」技術を使わなくても、人間による調整でここまで人間に近い歌を歌わせられることを改めて実証しています。


D


この一ヶ月で投下された動画は、音声合成ソフトが使い方次第で、既に人間と遜色ないほどリアルな歌を歌わせることができることを実証したと言えます。

ただ面白いのは、この一連の動画によって、人間に近いリアルな歌唱が必ずしも魅力的な歌唱ではないことが明らかになってきたことです。これは、多くのニコ厨は既に初音ミクなどのVocaloidの歌声を聴き慣れており、本来技術的な不完全性故に生じた、Vocaloid特有の歌の平坦さやぎこちなさを、そのVocaloidの個性だと感じるようになっていたことを意味しています。

初音ミクなどのVocaloid がキャラクターとして、ある種の仮想人格を与えられているのは色々なところで指摘されていることですが、この仮想的な個性は、ビジュアルや歌声だけでなく、歌い方にも付与されているようです。私もそうだったのですが、「ぼかりす」の初音ミクの歌を聴いたときに、少なからぬ人が、この歌はミクっぽくない、人間に近いけれどもミクの歌としては魅力的ではないと感じたようです。

このことは、音声合成ソフトは、人間の歌唱をより厳密にシミュレートすることだけではなく、ある意味2.5次元的な3DCG のように、人間の歌唱とは違う方向に発展する可能性を持っていることを示していると思います。現在でも、ヴォコーダーを使ったロボット的な歌唱や、アイドルの音程の外れた歌唱が好まれることもあるなど、魅力的な歌の方向性は様々であるといえます。その意味では、音声合成ソフトは、人間的な歌唱をシミュレートするだけでなく、音声合成ソフトならではの新しい歌の魅力を作り出していると言えるのかも知れません。

個人的には、Perfume 的な無機質な歌唱に関しては、Perfumeのようによほど上手く行っている例以外では、既に初音ミクの方が人間より上手く歌えるのではないかという気もしています。初音ミク曲を人間が歌っている動画がありますが、このような動画の歌を聴くと、きちんと録音や処理をしていない場合には、人間の歌唱は初音ミクと比べると、かなり聴きにくいように、私には感じられます。もちろん、私がこう感じるのは、Vocaloidの不自然な歌唱に慣れているからだと思いますが、おそらく遠くない未来に、大半の人の耳にも、よほど上手かったり、魅力的だったりする歌手を除けば、人間より音声合成ソフトの歌唱の方が優れていると感じられるようになるのではないかと思います。

いずれにせよ、もう音声合成ソフトは人間とほぼ遜色ないところまで来ているので、技術的進歩の早さには驚かされます。



VOCALOID2 HATSUNE MIKU

VOCALOID2 HATSUNE MIKU