非VOCALOIDのVOCALOID文化

 UTAUのカテゴリ問題を改めて考える - 煩悩の反応学の続き。

前回、UTAUがニコニコ動画でカテゴリ迷子になっている話から、VOCALOIDという用語の語義拡張の話まで概要を整理してみた。この問題は、単なる定義論ではなく*1、我々が歌声合成文化とどう向きあっていくべきかを考える端緒となる話題だと思っている。したがって、私がまずしたいのは整理整頓である。この手の議論は中身のない言い争いになってしまうことも少なくないが、その原因の多くは「前提条件の不一致」「相互認識の不足」だったりする*2。クリエイター達が状況に一石を投じようとしている今、なるべくそのような可能性を減じておきたい。

カテゴリ問題との区別

UTAUのカテゴリ問題は、あくまでニコニコ動画における「カテゴリタグ」の取り扱いにおける問題だ。それ以上の意味を孕んでいることは確かだが、VOCALOIDという用語をどう扱うべきかという問題と、UTAU関連動画をVOCALOIDタグで扱うべきかという問題は、レイヤが違うことを注意しておきたい。後者はニコニコ動画というサービスがどうあるべきかという話が含まれてくる*3

また、更に細かい点を言えば、歌声合成文化全体の話と、音楽の話も区別する必要があるかもしれない。例えば、デスおはぎさんらの試みは「UTAUを用いた楽曲の動画を」というものであることは今一度確認しておこうと思う。もはや歌声合成文化(ボカロ文化)は音楽だけでは語れないのだから。

ここでは、まずはVOCALOIDという用語について掘り下げていく。

「VOCALOID」の多義性

現状でVOCALOIDという用語の意味として以下が考えられる。

  1. ヤマハが開発した音声合成技術、及びその応用製品の総称*4
  2. 応用製品に設定されたキャラクター
  3. 上記の技術またはキャラクターに関する文化(広義すぎるので「VOCALOID文化」など)

1〜2は問題あるまい。問題は3である。この文化ないし文化圏というものが、何をどこまで包含し、そのうちどこまでを「VOCALOID」と呼んでよく、どこまでが「VOCALOIDタグ」でタグ付け可能なのか。
 
なおしつこいようだが、一般に、タグ付け可能であることとニコニコ動画でタグをあてられるか否かは別の問題だ。しかしここでは比喩のため明確には区別しないので、以下の比喩で用いる「タグ」とはニコニコ動画のタグだと思っていただきたい。

タグ付け可能性

VOCALOID技術や製品を用いて作られた動画には1の意味でVOCALOID動画として分類できる。例えば、初音ミクをボーカル起用した楽曲の動画、鏡音リンに日常会話をさせた動画*5などである。

2の意味では例えば、GUMI*6と猫村いろはがステージで踊る動画(音声は起用しない)みたいなものがあたる。この文脈も割と確立されていると思われるが、それでも二次設定や派生キャラはどうするのかという問題がある。私は少なくとも派生キャラは3の文脈で語るべきだと思っている。

そして問題の3だが、まず派生キャラについて。VOCALOID派生キャラとは、VOCALOIDキャラクターを元に派生したキャラクターを指す。例えば、はちゅねミク、弱音ハクなどであり、一般には彼らに関する動画にもVOCALOIDタグはつけられるようになっている。

ここで、重音テトは一般にはVOCALOID派生キャラとされるものの、VOCALOIDタグはつけられない。彼女をはじめとするVIPPALOID勢は特定のVOCALOIDキャラから直接派生したキャラでは無いが、VOCALOID製品と密接に関わった存在であるため、非VOCALOID勢の中でも派生キャラとして扱われやすい*7。しかし、彼らが非VOCALOIDの音源ライブラリと密接に結びついていることもあり、VOCALOIDタグがつけられることは非常に少ない。

また、初音ミクを3DCGにして踊らせる目的で作られたMMD、VOCALOID文化を参考に構築されたUTAU界隈の歌声合成文化も、VOCALOID文化を端緒としている。これらをそのまま「VOCALOID」というタグでくくるべきではないが、少なくとも「VOCALOID文化」「ボカロ文化」といった場合このあたりの潮流も語られる対象となり得るだろう。

非VOCALOIDのボカロ文化紹介

非VOCALOIDのボカロ的文化を指してUTAU、UTAU文化と通称されることがあるが、必ずしもUTAU(第一義的にはツール名)と関係するわけではないので厳密ではない。しかし、非VOCALOIDも含めて「ボカロ文化」と呼ぶことを容認するならば、非UTAUも含めて「UTAU文化」と呼ぶことが容認されてもいいだろう。

また、桃音モモ、雪歌ユフ、春歌ナナのようなキャラクターを「UTAU」「UTAUキャラ」ということもあるが、これも細かく見ると同じような理由で適切ではない。しかしそれでは彼女らを総称する適切な用語が存在しないことになるので私は「UTAUキャラ」と呼ぶようにしている。音源ライブラリを指す場合も、UTAU専用でなくとも「UTAU音源」ということが多い。

このあたりの事情はVOCALOIDと異なるので確認しておこう。VOCALOIDでは製品=音源ライブラリ=キャラクターが成立する。そのため初音ミクは「VOCALOID」であるといえる(VOCALOIDという語感の良さもある)。しかし、雪歌ユフらのような「UTAUキャラ」はキャラクター=音源ライブラリという紐付きはあるのだが、VOCALOIDと違ってその音源ライブラリは、基本的に合成エンジンやエディタに縛られない。UTAU以外のツールでも歌声合成は可能だし、実際にそのような作品は存在する。ちなみに上記の例では、春歌ナナは「UTAU用音声ライブラリ」と銘打たれているが、雪歌ユフは音声ライブラリに対して「UTAU向けに創作したキャラクター」であったりする。このあたりの事情は音源ライブラリごとに色々と違うのだが、通常はあまり気にしなくてよいだろう*8。

UTAUとVOCALOIDの違いで一番大きいのは「自分で音源ライブラリとキャラクターが創作できること」だろう。この点は、ボカロ文化でよく見られる二次設定や派生キャラ創作の楽しみを、一次創作レベルまで拡張したものとみなすことが出来る。実際、UTAU文化におけるキャラクターでの「遊び」方はVOCALOIDのそれと非常によく似ている。UTAU文化そのものがVOCALOID派生文化であることが良く現れていると思う(なお、派生とは拡張という意味だ)。

なお、UTAU界隈ばかりを紹介してきたが、他の代表的歌声合成ツールとしては例えばSinsy(ニコ百)がある。こちらは任意の音源ライブラリを使えるわけではないしキャラクターも作られていないが、歌声合成文化の中では重要な地位を確立してると思う。SinsyはUTAUと関係しない*9ので、UTAUタグもつけられず、Sinsyタグで探すことになる。こちらでもやはり「歌声合成」を総称するタグが欲しくなってくるわけである。

その他にも人力VOCALOIDと呼ばれるようになった音声切り貼り技術*10や、歌向けではないテキスト読み上げツールの音声を歌声化する技術*11なども非VOCALOIDの歌声合成文化として代表的だ。これらは明らかにVOCALOIDにインスピレーションを受けて発展を続けており、ボカロ文化を構成しているといえる。

歌声合成文化からボカロ文化へ

以上、VOCALOIDを端緒とした歌声合成文化が如何に広がりをもっているかということを確認してきた。音楽だけではなく、キャラクター文化や技術文化への広がりを持っており、もはや一つの側面だけでは語れないのが現状である。そういう意味ではもはや、私が好んで用いている「歌声合成文化」という通称ですら適切ではない。やはりこの文化圏の性格を象徴出来るのはVOCALOID、あるいはボカロという用語であり、「ボカロ文化」という語がますますしっくり感じられる。

このような現状を共通に踏まえた上で、ボカロ文化の議論をしていければと思う。


9/18 id:ja_bra_af_cuさんの呟きを受けて人力VOCALOIDなどの記述を追加してみました。脚注がたっぷり増えたw

*1:定義論はアプローチと時期が適切でさえあれば大切な議論である。物事の本質を”今"どう表現するのが適切かという。

*2:というかどのような議論でもコレが噛み合わない原因になるの言うまでもない。例えば、動画コメントですぐケンカが発生するのは、前提条件の確認と相互認識が不可能だからだ。

*3:タグ付け可能性と語義は表裏一体であり、厳密に区別して議論するのは難しい。しかし「ニコニコ動画」という文脈ではサービス方針、ビジネスの観点も加わる。そこは区別したい。

*4:VOCALOID - Wikipediaから引用

*5:トークロイドと呼ばれる。歌用であるVOCALOID製品を使って平文の会話を表現する。詳しくはトークロイドとは (トークロイドとは) [単語記事] - ニコニコ大百科

*6:MegpoidというVOCALOID製品のキャラクター。メグッポイドとは (メグッポイドとは) [単語記事] - ニコニコ大百科

*7:ちなみにVIPPALOID派生キャラもいるのだから、キャラクター文化というものは外からみればややこしいったらありゃしない

*8:こういうややこしい話をすると、また「UTAU文化」がよくわからないという感想を抱かれそうだが、ややこしいのはボカロ文化どこ見ても同じである。今回は一応「細かく考えるとこういう違いがあるよ」という意味で取り上げただけで、あまり気にしておよび腰にならないでほしい

*9:耳ロボPがUSTファイル(UTAU用の楽譜ファイルみたいなものでVOCALOIDでいうVSQ)→Sinsy用ファイルの変換ツールを作ったりもしているが http://freett.com/nwp8861/soft/utau2sinsy/index.html

*10:昔からある技術で、こう呼ばれるようになるまではMAD技術として取り扱われることが多かったと思う。VOCALOIDやUTAUのような技術と区別されるのは「ライブラリから合成するのでなく必要シーンに合わせて素材を選んで繋ぎ合わせる」という匠の技であり、非常に人間に近い発声まで実現されている。ちなみにUTAUは人力VOCALOID支援ツールとして開発されている

*11:要するにトークロイドやHANASUの逆