西田宗千佳のRandomTracking

第579回

Apple Vision Pro買ってきた日記 3日目:Vision Proの価値を総括する

Apple Vision Pro

Apple Vision Proをハワイで購入してから一週間ほどが経過した。その間も毎日使っているが、より色々と状況が見えてきたところはある。

購入時のファーストインプレッション・機内体験を含めたオーディオビジュアル体験と、それぞれ記事化してきたが、最後のまとめとして、一週間の間どんなふうに使ってきたのか、そこでどんなことを考えたのかを改めて考えてみたいと思う。

なお、Vision Proには日本国内で使うために電波法上定められた「技術基準適合証明」が明示されていない。そのため、総務省の「技適未取得機器を用いた実験等の特例制度」の活用を含め、適切な配慮のもと利用している。

また、Vision Proは現状、アメリカ市場のみで売られている。そのため、利用には「基本的に」アメリカ向けに発行されたApple IDが必要になる。日本語未対応問題・技適未対応問題を含め、現状、日本での利用を広く勧められるものではない。

ただ、製品として非常に価値の高いものなので、今後日本向けの発売が始まった時の参考としてお読みいただきたい。

いまはこれでしかできないことがある

「Vision Pro、買いなんですか?」

この一週間で、何回もこの質問をされたようにも思う。そしておそらく本当は皆、「50万円を超えるのに」というフレーズを、この質問の前後にくっつけたかったのではなかろうかと思う。

私の回答は明快だ。

「今日の段階で、50万円出して皆に『すぐ買いなさい』とは言いません。しかし、他ではできない体験なのは間違いないし、今買うからわかる・楽しめることもあります」

できることと価値のバランスを考えた場合、今の価格は確かに高い。特に、日本円換算した時の50万円を超える価格に納得できる人は少なかろう……と思う。

しかし、この体験と同じことを、同じクオリティで体験できる機器は他にない。そしておそらく短期的には、同じレベルを実現する場合、ハードウエアのコストはそれなりに高いものが必要になる。すなわち、Vision Proの代わりは現状存在しない、ということになる。

ビデオシースルーという意味で、Meta Quest 3は似たこともできる。だが、近いところが歪むし、解像感はVision Proの方がずっといい。つけたまま隣の部屋に行って戻ってくる……という使い方をしても問題ないのは、Vision Proの美点と言える。

Vision Proの中で作業中の視界を複数枚撮影し、つなげてみた画像。だいたいこんな環境に囲まれて作業ができる

なお、上記の画像にある「ボケ」は、Vision Proが、視野の中央以外の解像度を自動的に落とす「Foveated Rendering」を自動的に適応している関係上、スクリーンショットにも不鮮明な部分ができるためだ。それを合成した結果不鮮明になっているが、実際にみるとまったく気にならない。

Meta Quest 3とVision Proを並べて比較。実はサイズはあまり変わらないが、Vision Proはバッテリー外付けである点に留意
Vision Proでウェブを表示しつつ、シースルーでスマホを見る。特に問題なく、自然に見える
同じことをQuest 3でやってみた。画像自体はけっこう鮮明なのだが、解像感が足りないので近づけないと読めないし、派手に歪みが出る

アプリケーションを複数空中に並べるという要素は、過去にマイクロソフトがHoloLensで試みたものでもある。以下の2つのビデオを見比べてほしい。上がVision Proの、下がHoloLensのレビューで掲載したものである。

Vision Proを動かしてみた動画
2017年の記事で掲載した、HoloLensを使っている動画
前傾のVision Proの画像と同じく、HoloLensを操作中の視界について、複数の画像をつないで再現したもの。8年前の製品だが、イメージはVision Proのものに似ている

ただ、両者が実現しているものには大きな差がある。それは、別の言い方をすれば「10年ほどの間のハードウエア進化の差」とも言える。

HoloLensはWindows Phone向けに作られていたOSとハードウエアを流用しており、発売された2016年当時でも性能には課題があった。当時のミドルクラス・スマホ程度の性能しかない。それに対しVision Proは、M2搭載MacBook Airと同等のプロセッサーを搭載している。M3が登場してはいるが、それでもノートPC向けとしては十分以上に高性能。両者の性能差は10倍以上あるのではないか。

HoloLensは光学シースルー方式で、CGが重なるのは視界中央のごく一部だった。性能面とB2Bでの安全性を考えると、当時としてこの選択は間違いではない。実際には前傾のビデオのようにも見えず、「中央の狭い四角の中にだけCGが重なる」のがせいぜいだ。

光学式シースルーには美点もあるのだが、PVと違う映像になってしまうことから「PV詐欺」的な批判もなされた。

だが、Vision Proはビデオシースルー方式なので、動画はまさに「利用者が見ているまま」だ。違うところがあるとすれば、視界周囲の解像度をぼかして処理負荷を減らす「Foveated Rendering」を使っているため、「利用者にはビデオより全体が鮮明であるように感じられる」くらいだろうか。

そしてもちろん、ビデオは二次元。実際に見ている絵は空間(三次元)なのでもっと体験が良い。

HoloLensの開発開始から10年以上、初代モデルの発表からは8年が経過した。マイクロソフトは自社ハードウエアとしてHoloLensの後継を作ることを諦めてしまったようだが、アップルは開発を続け、今のハードウエア性能を活かしてVision Proを世に出した。

iPadをベースとしつつも大きく異なる特性

Vision Proが使っている「visionOS」は、あきらかにiPadOSをベースとしている。両者の主な設計思想の違いは、アプリを画面全体で占有(もしくは2つ、3つに分割)して使うのか、空間全体にアプリを散りばめて使うのか、というアプローチにある。

そういう意味では、Vision Proは現状、映像を見たりウェブを見たりという用途に一番向いている。

紀伊国屋書店KinoppyがアメリカのAppStoreでも公開されていたので、拙著を表示してみた。大きな空間に本を浮かせて読めるのは新鮮

「50万円出してそれだけか」と言われそうだが、そうしたことを「空間全体を使ってできる」のが美点であり、アップルの定義する「空間コンピューティング」なのだ。

アプリケーション自体もiPadの流儀から出来上がっているものが多いので、「Excelの文書を複数同時に開く」ような使い方ができるかどうかは、アプリによる。(ちなみにWordやExeclも専用版があり、日本語表示も含めて可能だが、「複数の文書を同時に開く」には「Open New Window」から開いていく)

Vision Pro版のExcelやWord、PowerPointでは、複数文書を空間に並べながら仕事ができる

ただ、Macの画面をそのまま持ち込めることで、実用性は大きく変わる。

以下は実際にそれをやってみたところだ。左右にあるのはVision Proアプリであり、中央はMac。操作もMacのキーボードとマウス(タッチパッド)で行なう。入力遅延などもほとんど感じない。接続は、MacBookをみると現れる「Connect」をタップするだけだ。同じApple IDで動いているMacが近くにあり、さらに画像認識でMacBook AirやMacBook Proの形を認識すると、「Connect」表示が出てくるようだ。

接続できるMacBookを視界に見つけると「Connect」が表示され、簡単につながる
作業画面は大きく表示。キーボードやタッチパッドはそのままMacにあるものを使う

さらに、Mac側のキーボードやタッチパッド操作がそのままVision Pro側の操作にも使える(は、MacのキーボードなどがまるでVision Proにもつながっているかのような挙動になる)ので、実用性はさらに高い。

これも「このためにだけに買いなさい」とは言わないが、他の環境を圧倒する体験だ。

筆者は個人で手に入るレベルであれば、ほぼ全てのVR機器で「PCの画面をVR空間に持ち込んで仕事する」方法を試したことがある。現状でもそれらは、すでに一定の実用性を備えていた。ただ、Vision Proでの体験は、確実に他を超えている。

制約は「基本的にMacのことしか考えていない」ことだ。Windows PCをRDPなどの技術を使って持ち込む方法もあるが、快適さ・接続の簡単さではMacの方が上ではある。ここも、サードパーティー製ソフトの充実で変わるかもしれない。

また、画面サイズが最大4K、Mac的にHiDPI表示すると2,560×1,440ドット程度に制限されるのも、現状の限界と言える。もっと大きいものや、もっと横長の表示も欲しい。

あくまでアップルの狙いは「空間コンピューティング」

他方で、アップルが考えているのはあくまで「空間コンピューティング」だ。

もちろんゲームのように、空間全体を1つのアプリケーションで占めるものも作れる。Vision OSでは「Immersive App」と呼ばれている種類のものだ。Apple Arcadeでの提供も含めいくつかそうしたタイトルはあるし、本体にバンドルされている「Encounter Dinosaurs」はその最たるものだろう。

「Encounter Dinosaurs」の体験部分だけを切り出して。これが3Dで表示されるのだからかなりの迫力だ

だが、手での操作だけで正確なコントロールをするのは難しい。VRコントローラーのために作られたゲームの移植には相当工夫する必要があるだろう。現状ゲームの数や種類を含め、Quest 3の方が進んでいるのは間違いない。ゲーム主軸ならQuestをお勧めする。

また、Quest 3向けには、Mixed Reality環境を強化するソフトウエアアップデートが近日中に行なわれる予定であり、そういう意味では競争が激化している……とも言える。

むしろVRのゲームにはこだわらず、PCやPlayStation 5、Xboxなどのゲームをストリームして楽しむのに向いている気がする。Vision Pro自体はDualSenseやXboxワイヤレスコントローラーに対応しているので、問題なくプレイできる。Steamについては公式の「Steamlink」が、PS5についてはサードパーティー製の「MirrorPlay」がアプリとして公開されている。

「MirrorPlay」でPS5をリモートプレイ。動作は通常のリモートプレイと変わらないが、画面が大きくなるのでかなりの迫力

なお、前回の記事で書いたように、映画は「没入環境」で見ることも想定されている。画質も表示品質もよく、特に3D映画はかなり良い。

著作権保護された映画はキャプチャできないので、再生画面に別の映像を合成したイメージ。こんな感じで「3D映画でも」体験できる

EyeSightとPersonaの価値とは

Vision Proには「EyeSight」という、外側を向いたディスプレイがある。

また、Vision Proでは、自分の顔をVision Proで立体的にキャプチャし、3D CGでリアルなアバターを作る「Persona」という機能も持っている。

EyeSightにはPeroneが表示され、自分の視線やまばたきが相手に見える。

筆者の顔をキャプチャし、EyeSightで表示。ぼやけていて変な感じだが、こちらをみているのはわかる

この機能は、レビューなどを見ると評判が良くない。「気持ち悪い」「自分の顔に見えない」など散々だ。「廉価版が出たら最初に無くなる」という声も多い。

筆者もPersonaを作ってみて、「そうかもなあ」と思った。

だが、表示を色々な人に見せていくと、少し意見が変わってきた。

「本人そっくり」という人は誰一人いないのだが、一方で「目が見えているので安心する」「見ているところがわかるので安心する」という声も非常に多いのだ。

これはアップルの狙い通りだろう。

そのために複雑で特殊なディスプレイである必要性があるか、という話はあるし、周囲に誰もいないなら電力も無駄なのでオフにしておきたいところだが、「目が見えることに意味はある」のだ。

Persona自体はビデオ会議に使える。ビデオ会議で使う自撮り用のカメラが、Vision Proでは「Personaを表示する仮想的なカメラ」になっている。だから、アップル標準のFaceTimeはもちろん、ZoomやMicrosoft Teamsでも使える。これも自分には微妙に似ていないのだが、「なにもしなくても使える」「ちゃんと相手に伝わる」のは重要だ。

Zoomを使ってVision Pro購入者同士で会話。相手が普通の機器を使っている場合なら、顔は実写になる

面白いことに、ビデオ会議のウインドウを出している場所と、Personaの顔の向きは連動している。要は、ビデオ会議のウインドウ=相手のいる場所として、Personaも「そちらを向いている」形で描画されるわけだ。だから、自分の斜め前にビデオ会議アプリを配置すると、相手からは自分が斜め方向を見ているように見えるし、横に配置すれば横を向いているように見える。なかなか無駄に凝っている。

Personaは、自分の顔を模したいわゆる「リアルアバター」だ。

VR関連の業界では、「一般に日本人はリアルアバターを好まず、欧米人は自分に似たリアルアバターを好む」と言われてきた。海外製ゲームと日本製ゲームのプレイヤーキャラの違いなどからの論説だ。

だが使ってみると、Personaには意外なほど違和感がなかった。少なくとも自分は、これが嫌いではない。自分が好きになれないのは、「3Dでモデリングされているが、実写とは異なるモデルを自分に寄せていく」タイプのリアルアバターであり、ちゃんと自分の顔が(それなりに)表現されているPersonaは、リアルアバターのはずなのにそこまで拒否感はない。

もちろん、リアルでないアバターでもコミュニケーションはできるようにして欲しい(それこそ、アップルなのになぜミー文字は使えないのだろうか)が、使ってみると、Personaが「SNSで言われるほど悪いものではない」ことは伝えておきたい。

個人設定の「厳密さ」が最大の壁

では課題はなにか?

重さや機能面を挙げる人も多いようだが、筆者がまず指摘したいのは「設定に対するセンシティブさ」だ。

購入時のレポートでも書いたが、Vision Proはメガネを併用できない。視力補正が必要な場合には、ソフトコンタクトレンズか専用のインサートレンズが必要になる。

筆者はこれまで普段メガネをかけており、今回Vision Proのためにソフトコンタクトレンズを用意した。

やはり、視力補正なしでは見え方に大きな違いが出る。だから、視力に不安がある人は、他のHMD以上に補正が必須かと思う。メガネ利用者なら、インサートレンズの購入を強くお勧めする。

ただ、筆者が言いたいのはそこだけではない。裸眼の人であったとしても、同様にセンシティブさが付きまとう。

というのは、Vision Proの操作性は「正確な視線認識」とセットで生まれるからだ。

つける人が変われば、視線認識の再調整はほぼ必須だ。これがズレると操作がままならず、かなりストレスがたまる。

筆者の場合、コンタクトレンズの有無でもズレが生じた。そのくらい「最適化」が必須である。他の人に気軽にかぶってもらって……というわけにはいかないのだ。

スマホがパーソナルな機器であり、他人に貸すことはまずあり得ないのと同様、Vision Proもパーソナルな機器として設計されているのだろう。

現状、「ゲストモード」はあっても、ユーザーを切り替えて使うモードは用意されてない。メインとなる持ち主は1人だけ、という思想だからだ。

とはいえ、現状は、色々な人に体験して価値を理解してほしいタイミング。個人に最適化した設定でないと使いづらいというのは、大きなリスクであるようにも思う。日常の使い勝手という意味でも、もう少し緩い方がいい。

高価でパーソナルで個人最適化が必須、という要素がどれだけ不利に働くかは、しばらく様子を見てみたくある。

進化途上を味わうところまで「価格」のうち

それ以外の課題も、もちろんある。

機能的にいえば、「まだOSができたて」であるが故の課題が多い。

その最たるものは「アメリカ市場専用である」「日本語に対応していない」ということだが、それ以外にも、

  • OSごと再起動することがある
  • アプリを強制終了させる方法が面倒
  • iPad/iPhoneアプリの操作がこなれていない
  • iPhoneとの連動が弱く、Face IDでのロックが邪魔になる
  • Magic Touchpadには対応しているが、マウスには対応していない

など、改善が進むであろうと予測される部分は多い。もしかすると、

  • 視線認識などのプロファイルを複数覚えておく

といった機能も今後追加され、面倒くささが解消されていくのかもしれない。

アプリケーションもまだ足りない。

発売直後なのでVision Pro専用のアプリが少ないのはしょうがないのだが、Vision Pro向けにインストールを許していないiPad版アプリも意外に多い。以前の記事でも触れたように、NetflixやSpotify、YouTubeなどのアプリがないのも、Vision Pro専用アプリが用意されていないということではなく、iPad版アプリのインストールを認めていないことによる。ただ報道によれば、YouTubeについては「公開時期未定ながら、アプリ開発に取り組む」とされている。

専用アプリについても、iPad版にちょっと手を加えた感じのものが多い印象を受ける。

本当ならば、アプリそれぞれが規定するウインドウサイズも「複数のウインドウを空中に並べる」前提であるVision Proでは変わってきて然るべき。たとえば音楽再生アプリは、あえて小さなウインドウにしておくこともできるはず。だが今はまだ、ウインドウサイズの選択すら多様ではない。

ここからアプリやOSの開発が進み、色々と進化していくのだろう。そういう意味では、このことを大きな問題と考えるべきではない。現時点でも、空間コンピューティング機器としては他の製品よりずっと先を走っているのだから。アップルは、これまでにiOSやiPadOSなどのために作ってきたコンポーネントを最大限活用しており、それだけ「初物」でも完成度を高めることができている。

Vision Proはここからの進化も含め、どう変わるかを楽しめる部分も含めて「3,500ドル」という印象は強い。今日の段階で、一片の無駄もなく役立つか、というとそうではない。

理屈としては、「大型ディスプレイやプロジェクターだと思えば」「Macの良いディスプレイだと思えば」「3Dビデオ・映画を楽しめる機器としては」と積み重ねると3,500ドルは高くない……という言い方もできるが、まあ少々無理やり感はある。

そうした価値を持ちつつ、進化も楽しむ機械だと思うのがベストだろう。「発展途上のものに高い金額を払うのか」という方もいそうだが、進化過程を楽しめない、受身の方には全く向いていないし、お勧めもできない製品だ。

日本で発売される時には、アプリやOSの課題もある程度目処がつき始めているだろうし、もう少し手が出しやすい製品になっていることだろう。まあ、価格が下がったモデルが出てくるには、年単位での時間が必要だろうが。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、AERA、週刊東洋経済、週刊現代、GetNavi、モノマガジンなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。 近著に、「生成AIの核心」 (NHK出版新書)、「メタバース×ビジネス革命」( SBクリエイティブ)、「デジタルトランスフォーメーションで何が起きるのか」(講談社)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Xは@mnishi41