藤本健のDigital Audio Laboratory

第898回

音楽も3Dで聴く時代まもなく? オーディオ大変革の期待と不安

アップルは6月より、Apple Musicにおいて、Dolby Atmosによる空間オーディオとロスレスオーディオのサービスを開始する

国内でもソニーが360 Reality Audioのサービスを本格的に開始したこと、さらにはApple MusicでDolby Atmosを用いた空間オーディオ配信がスタートするなど、にわかに“イマーシブオーディオ”(3Dオーディオ、立体音響などとも言う)が活況を呈してきた。

ただ、規格という意味ではイマーシブオーディオは乱立状態といっても過言ではない。直接比較すべきものかどうかは別として、現在はDolby Atmos、Auro-3D、DTS:X、そして360 Reality Audioと、さまざまなフォーマットが存在する。

ユーザーとしては混乱するし、作り手にとっても無駄が多くなりそうな気もする。スピーカーで聴くのか、バイノーラルの2chに畳み込んで聴くのか、サウンドバーなどを用いて聴くのかなど、再生方法もいろいろあるため、一般のユーザーにはますますわかりにくくなっているように感じる。

今回は、このイマーシブオーディオの規格という面から、少し気になっている点を見ていこうと思う。

規格ごとにスピーカー設置が異なるイマーシブオーディオ

先日来、本連載では360 Reality Audioについて、ソニーに取材したり、制作現場を取材するとともに、自身でもそのサウンドを聴き、ソニーが本気になって取り組んでいけば面白い世界が展開していくのではないかと感じていた。

そんなタイミングで発表されたのが、Apple Musicの新機能だ。

以前から、Apple Musicではハイレゾ配信が行なわれるという噂があったが、大々的に発表されたのはハイレゾではなく、ロスレスと空間オーディオ(Spatial Audio)の方だった。

アップルの空間オーディオは、'20年秋発表のiOS 14からサポートしている機能。AirPods Proなどと組み合わせることで立体音響を再現できる

リリースによれば、Apple Musicの空間オーディオにはDolby Atmosの技術が採用されており、Apple Musicユーザーは、6月から追加料金なしに、これらの新機能・新コンテンツが利用できるとのこと。本稿を書いている6月6日現在、まだスタートはしていないようなので、詳細は分からない。

ただ、発表内容には「Apple MusicはH1チップまたはW1チップを搭載したすべてのAirPodsとBeatsのヘッドフォン、および最新バージョンのiPhone、iPad、Macの内蔵スピーカーで、ドルビーアトモス対応の曲を自動的に再生します。Apple Musicは新しいドルビーアトモス対応の曲を常に追加し、リスナーが好きな音楽を見つけやすいようにドルビーアトモス対応のスペシャルプレイリストもキュレーションする予定です。さらに、ドルビーアトモス対応のアルバムは詳細ページにバッジが表示され、簡単に見つけられるようになります」とある。

また「サブスクリプションの登録者は、選りすぐりの世界のトップアーティストたちや、ヒップホップ、カントリー、ラテン、ポップ、クラシックなどのあらゆるジャンルの音楽から、数千曲を空間オーディオで楽しむことができるようになります」とも書いてあり、まさにソニーの360 Reality Audioと真っ向勝負ともいえる内容だ。

しかしここで気になるのは、アップルのDolby Atmos(空間オーディオ)やソニーの360 Reality Audioのデータ。

例えば、これまでのApple Musicや他の音楽配信サイトで聴くことができる音源は、もとを辿れば、そのほとんどはCD用にマスタリングされたデータを変換したもの。もちろん中には、こだわりを持ってApple Music用とか、mora用とか、エンコードやマスタリングの微調整をサービス別に行なっていたケースもあるかもしれないが、それらは極めて稀なはず。大半はCD制作時のデータを変換するシンプルなものであり、リスナー側は細かなことを気にすることはないし、作り手側も簡単に複数の配信サイトに同時展開することができた。しかし、イマーシブオーディオの場合は、そう簡単にはいかない。

なぜか。その根本的な問題と考えるのは、フォーマットによるスピーカー配置の違いだ。

最近、いろいろなところで話題になるイマーシブオーディオ、直訳すれば“没入感のあるオーディオ”は、定義があいまいのため、ピンと来ていない人も多いと思う。

単刀直入にいってしまえば、ハイトスピーカーのあるサラウンド環境でのオーディオだ。従来の5.1chや7.1chは水平方向に複数のスピーカーを設置して聴くものだったが、イマーシブオーディオは高い位置にもスピーカーを設置して聴くものとなっている。だからこそ、より立体的に聴くことができて没入感が味わえるわけだ。

ここで問題になるのが、スピーカーの配置。従来の5.1chサラウンドであれば、Dolby DigitalでもDTSでも正面(センター)、フロントの左右、リアの左右とサブウーファーという基本構成は大きく変わらなかったので、互換性を持たせることは容易だった。ところが、現在のイマーシブオーディオは、各社の規格が完全にバラバラだ。

たとえばAuro-3Dの9.1chの場合、5.1chのスピーカー中のフロント左右、リア左右の真上に4つのスピーカーを設置するというレイアウトになる。

Auroー3Dの9.1chレイアウト

一方、Apple Musicが採用するDolby Atmosの場合、シアター用の7.1.2chでは、サラウンド7.1chの構成に加え、天井の左右に2つのスピーカーを置くレイアウトとなる。

Dolby Atmosの7.1.2chレイアウト

先日本格スタートしたソニー360 Reality Audioの場合は、スピーカー設置での視聴については正式なアナウンスがなく、現時点においてはヘッドフォンで聴くか、認定したスマートスピーカーで楽しむしかないが、制作環境では、サブウーファを使わない13chのレイアウトになっている。

配置に関する資料が見当たらなかったので、ソニーの話や先日取材した佐藤純之介氏のスタジオで見たものを元に筆者が勝手に作ったのが下図だが、上、中、下の3レイヤーで計13個のスピーカーを設置する構成になっている。

360 Reality Audioのレイアウト。13chのスピーカーで構成され、サブウーファはない。中心からフロントLRは30度、サラウンドLRは110度の配置になっているという
音楽プロデューサー/エンジニア 佐藤純之介氏の360 Reality Audio対応スタジオ

NHK BS8Kの22.2chを挙げれば、これも3層でやや複雑な配置となっているが、従来の5.1chや7.1chサラウンドと互換性がとれるよう、下図のような配置になっている(第727回参照)。

NHK BS8K(スーパーハイビジョン)で用いられている、22.2chレイアウト

皆がイマーシブオーディオを楽しめる世界に進むことを期待

イマーシブオーディオとおおまかに括っても、それぞれの規格を見ていくと、レファレンスとするスピーカー配置がバラバラで、まとまっていないのが実態だ。もっとも、日本の家庭を考えた場合、従来のサラウンドスピーカーでさえ、配置できている人はAVファンなどに限られているため、それを複雑にしたイマーシブオーディオの設置はほとんど方が無理だろうというのが実情。

そのためもあって、今回のソニーも、アップルも、ユーザーにはリアルにスピーカーを設置させるのではなく、ヘッドフォンのバイノーラルで聴かせたり、バーチャルサラウンド技術を用いて簡易に設置したスピーカーから音を拡げて聴かせようというのが主眼に置かれている。

その意味ではユーザーはより簡単にイマーシブオーディオを体感できるようになるため、従来のサラウンドよりもさらに簡単になった、とも言え、歓迎すべき点ではある。

Dolby Atmos、360 Reality Audioをサポートする、Amazon Echo Studio
ソニーの360 Reality Audio対応スピーカー「SRS-RA5000」(右)と「SRS-RA3000」(左・中央)

ただ、バーチャルサラウンドやヘッドフォンでのバイノーラルの技術は発展途上であり、まだ確実なものであるとは言い難い状況。

ヘッドフォンでのバイノーラルサウンドの場合、頭部伝達関数(HRTF)を使ったシステムを利用することで、それなりにリアルに聴こえるようになってきているが、それを実現するには各自の頭や耳の形状などを測定する必要があるし、その聴こえ方も人によってかなり差があるのも事実で、一筋縄にはいかない。

ソニーの360 Reality Audioをヘッドフォンで聴く場合、HRTFの測定にはスマホで耳の形状を撮影することで実現しているが、アップルが今後対応製品を拡大していく際、どのような手法で品質を担保するのかは気になるところ。

ソニーはアプリ「360 Spatial Sound Personalizer」を使って、スマホで耳の形状を撮影。HRTFの個人最適化に利用している

ただ、いずれにしても制作サイドに目を向けると状況は大きく異なる。

イマーシブオーディオ用のコンテンツを作るには、従来のCD用にミックスされた曲を単純変換すればよいわけではなく、現状はイマーシブオーディオに対応したスタジオで、それに精通したミックスエンジニアが1曲1曲作る必要がある。360 Reality AudioとDolby Atmosでは、スピーカーの設置位置が異なるわけで、当然、音のバランスのとり方も変わってくるし、そもそも利用するツールに違いがあるから、両方のコンテンツ用にそれぞれ作る必要がある。

ソニーも、アップルも、世界中の音楽レーベルやミックスエンジニアなどにコンテンツ制作を依頼するなど、資金を投じているようなので、両方を手掛けるところも出てくるとは思うし、競争が始まって資金がたくさん出ている今なら一儲けできる、という考え方もあるが、各社が今後どこまでイマーシブオーディオを続けていくのか? という点で不安も感じるところ。

また各社のコンテンツを見ると、過去作品をイマーシブオーディオ化する例がほとんどで、中にはデヴィッド・ボウイなど、すでに他界したアーティストの作品もイマーシブオーディオ化されているようで、これは本当にアーティスト本人が望む世界観なのか? と心配になってしまうところもある。

ソニーの360 Reality Audioのライブラリ(一部)

一方で、そもそも現時点のバイノーラル技術でイマーシブオーディオにどれだけの人が興味を持つのか、真剣にその音を聴いてくれるのかも気になる。リスナーが興味を持たなければ、コンテンツも増えていかないだろうし、つまらない作品ばかり増えても、その評価は下がってしまうので、その点も気がかりだ。

個人的には、久しぶりにやってきたオーディオの大変革であり、ヘッドフォンで気軽に立体音響が楽しめるようになるのは大歓迎ではあるけれど、メーカー間の無駄な競争で、疲弊してしまわないのか、またユーザーが分かりやすく親しめる環境が整うのかなど、気になることもいっぱい。ぜひ、皆がイマーシブオーディオを楽しめる世界へと進んでいってくれることを願うばかりだ。

藤本健

 リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。リクルート在籍時代からMIDI、オーディオ、レコーディング関連の記事を中心に執筆している。以前にはシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったこともあるため、現在でも、システム周りの知識は深い。  著書に「コンプリートDTMガイドブック」(リットーミュージック)、「できる初音ミク&鏡音リン・レン 」(インプレスジャパン)、「MASTER OF SONAR」(BNN新社)などがある。またブログ型ニュースサイトDTMステーションを運営するほか、All AboutではDTM・デジタルレコーディング担当ガイドも務めている。Twitterは@kenfujimoto