愛犬と“おしゃべり”できるスマート首輪、その実態とは

飼い主が愛犬や愛猫と会話できるようにすることを目的とした、“話す首輪”が登場する予定だ。しかし、大量のセリフから生み出される会話が、実際のペットの行動と一致していないときもある。
A good good wearing a blue collar with a speaker on it.
Courtesy of Shazam

人類は言葉を発 見して以来、動物と会話しようと試みてきた。現代ではテクノロジーを活用し、犬には会話ボタンを押すよう覚えさせたり、人工知能(AI)を使ってクジラの言葉を理解しようと試みたりしている。

そのようななか、人間と動物のコミュニケーションにおいて、最新かつ最も直接的なアプローチとして登場したのが、音声認識対応の首輪「Shazam」だ。この首輪を使えば、まるでペットが飼い主に話しかけているかのように感じられる。少なくとも、それが狙いだ。

米国テキサス州オースティンを拠点に「tech guy」(技術者)と自称し活動するジョン・マッケールは、Personifi AIというスタートアップを運営している。この会社の目標は、名前が示す通り「すべてを擬人化する」ことだと彼は説明する。そのための最初のステップが、いまのところはペットなのだ。

同社が開発した首輪にはスピーカーが内蔵されており、ペットに話しかけると(正確には、首輪に話しかけると)、あらかじめ録音された人間の声で返答がある。この技術により、ペットが人間のような性格をもち、英語を話す能力があるかのように錯覚させるのだ。現時点では犬や猫のみにしか対応していないが、マッケールは最終的にほかの動物や人間用のウェアラブルデバイスにも展開したいと考えている。

マッケールがこの話す首輪のアイデアを思いついたのは、愛犬ロスコーがガラガラヘビに噛まれた時のことだった。マッケールは当初、すぐに何が起きたのか気づかず、数時間後にロスコーの体調が悪化してから事態を把握した。ロスコーは無事で現在も元気だが、動物病院で10日間の入院をしなければならなくなり、高額な治療費もかかった。この経験はマッケールに強い印象を残し、もしロスコーが何が起きたのかを伝えることができたなら、もっと早く対処できたのではないかと彼は考えるようになった。こうして「Shazam」のアイデアが生まれた。

ペットの安全や健康の機能も備えた首輪

ちなみに、この「Shazam」という名前は、スーパーヒーロー映画や有名な音楽検索サービスとは無関係だ。ペット用のShazamはマイクと音声装置を内蔵しており、飼い主の声を聞きとり、自身の音声で応答する。あたかもペットが会話しているかのように感じさせるための仕組みだが、実際に話しているのは首輪に搭載されたチャットボットだ。

「まずは存在の状態をとらえることから始めます」とマッケールは説明する。「人間やペット、そして周囲のさまざまな環境を測定し、それらの変化要素が、わたしたちが構築する『認知皮質』、つまり機械学習や大規模なデータセットに基づいた入力データとなります」

このようなペットのための世界を構築するには、決して安くはない。首輪の価格は猫用が495ドル(約74,000円)、犬用が595ドル(約89,000円)からで、さらに年額195ドル(約29,000円)の猫用および「ウルトラ」首輪のサブスクリプション、または年額295ドル(約44,000円)の「ブレインブースト」サービスが必要となる。

このブレインブーストサービスは、「共感や推論、社会的認識、自己認識といった本当に感覚的な特性」を提供するものだとShazamの担当者は言う。いずれのサブスクリプションも最初の1年間は無料だが、その後は自動更新される。ブレインブーストなしでは、首輪は一般的な声に戻り、特性を失ってしまうため、最良の体験を得たいなら年額295ドル(約44,000円)のサブスクリプションを続ける必要がある。

首輪は現在予約注文が可能で、出荷は2025年2月以降の予定だ(これは、ペンダント型AIデバイス「Friend」など、いま支払っても実際の受けとりは来年になるAIウェアラブルデバイスのひとつだ)。

Shazamは、ペットが「話す」ように見せかけるだけではなく、いくつかの実用的な機能も備えている。例えば、首輪のマイクとセンサーはガラガラヘビの音を検知したり、ペットが行方不明もしくは誘拐された場合に通知を送信したりできる。ペットに何かあった場合、すぐにアラートやメッセージが届く仕組みだ。

また、首輪は日々のルーティンを追跡し、犬が特定の時間に餌を食べる音を検知することで、食事をしていないことを検知すると声でリマインドしてくれる。もちろん、マイクが常にオンになった状態の首輪をペットに装着することに対するプライバシーの懸念も考慮する必要がある。しかし、安全面や健康管理の機能での利点は、このスマート首輪をペットに装着する十分な理由になるだろう。

しかし、Personifi AIが主に売りにしているのは、やはりチャットボット機能だ。

カスタマイズ可能な27種類のキャラクター

「チャットボット」という表現は適切ではないかもしれない。スタートアップ「Eleven Labs」のようにAIが生成した合成音声ではなく、Shazamはあらかじめ録音された 人間の声を使用している。選べるキャラクターは27種類で、それぞれ異なる個性をもち、すべてが声優によって演じられている。首輪の設定時にひとつのキャラクターを選び、別のキャラクターに変更する場合は99ドル(約14,000円)がかかる。

Personifi AIによると、各キャラクターの音声には8,000近くのセリフがあり、必要に応じて今後さらに追加予定だという。確かに大量のセリフだが、Shazamのペットの声は動的に進化するチャットボットというよりも、ビデオゲームのNPCからが発する声のようなものだ。マッケールは、将来的に音声合成が導入される可能性があり、テレビで見ているサッカーの試合のスコアに首輪がコメントをするようにあるかもしれないと述べている。

Shazamの音声はどれも『ドクター・ドリトル』風の短いフレーズやジョークを交えるものが多い。愉快で可愛らしいキャラクターから、うっとうしいものや気難しい性格まで多岐にわたる。奇妙なことに、ウェブサイトではすべて人間のアバターのイラストで表現されている。例えば、「抱きしめたがり」、「優しい」、「愉快」といったタグがついた少女「ベラ」がいる。また、「子ども好き」、「ノーベル賞受賞者」、「小児がん」といったタグがついたニコニコ顔の男性科学者、「ゲイツ博士」もいる。いたって“典型的”なペットの個性だ。

マッケールによると、これらの性格は、バラエティに富むように設計されており、また、人々が自分のペットに抱く一般的な性格とも一致するように調整されている。

「市場を徹底的に調査しました」とマッケールは語る。「ほとんどの人は自分のペットの性格に関して何らかの考えをもっています。それが驚くほどに」

Shazamのアプリでは、ペットの性格やユーモアの度合いを下げるなどさらにカスタマイズできる。設定によっては、ペットを深い存在論的なレベルにまで導くこともできる。例えば、ペットの価値観として、思いやりや正義、勇気などを選ぶことができ、宗教的信念や許しの力、自由、運命、宿命についての考え方も設定できる。さらには政治的見解やグローバリズムのような幅広いトピックについても意見をもたせることができる。カスタマイズの量は途方もないが、これらの設定が実際にペットが外で用を足したいと意思表示する際にどれほど影響するのかは不明だ。

実際に首輪を犬につけてみたら

マッケールはZoom通話でShazam首輪のデモを見せてくれた。愛犬ロスコーというガラガラヘビに噛まれた経験をもちながらも、非常にお利口なチョコレートラブラドールが、首輪を装着し、マッケールやほかのPersonifi AIのスタッフと一緒の部屋にいた。ロスコーのハンドラーがおやつを見せて話しかけると、動物アテレコで知られるボイスオーバー声優のボビー・ジョンソン、別名「The RxckStxr」の声で首輪が返事をした。

「ロスコー、調子はどう?」と世話係が尋ねる。

「水をガブ飲みできそうな気分だね」とロスコーの首輪が答える。

「そうか、だからリスを追いかけたくないんだね。今日は一日中水を飲んでいなかったしね。悪かったよ。でも、愛しているよ、ロスコー」

ロスコーは「散歩に行こうよ、そしてどれだけボクを愛しているか教えてよ」と話す。

楽しいやりとりだが、ロスコーが言っていることは彼の行動と必ずしも一致していない。わたしには、ロスコーが水を欲しがっているようには見えなかった。むしろ、彼は部屋にあるおやつに集中していたのだ。もし彼がその瞬間に自分の考えを声に出せたなら、「おやつがあるのはわかっている。早くちょうだいよ」と言ったかもしれない。

シチュエーションによってはうまく機能することもある。別の例では、ロスコーと引っ張り合いの遊びをしていると、首輪のセンサーがその遊びの活動を感知し、ロスコーのふざけた声で「今日の予定をすべてキャンセルしたほうがいいよ、一日中続けられるから!」と言い、その後、喉から低い遊びのうなり声が続いた。

「ペットと人間の絆の本当の恩恵は、人間側に」

Shazamの首輪に備わる大量のセリフは、ほとんどの犬の単純で大げさな性格に近いものを再現できるかもしれない。しかし、ターゲットとされている もう片方のペット、猫の場合は話が違う。猫を理解するために必要な会話は、もっと複雑だ。

サンフランシスコで猫のトレーニングと行動コンサルタントサービス「Go Cat Go」を運営するダニエル・"DQ"・クアグリオッツィは、人々はしばしば猫が実際に何を望んでいるのかを誤解していると言う。さらに、猫がそもそも首輪をつけさせてくれるかどうかはともかく、おしゃべり首輪がその誤解を解消する手助けになるとは考えにくいと彼は語る。

「現実的には、首輪は『このクソ首輪を早く外せ』と言い続けるだけでしょう」とクアグリオッツィは言う。

ペットから明確な答えを引き出すのは難しいが、経験していると思われる状況に近い声をセンサーつきの首輪が発することは、動物を理解する最も効率的な方法とは言えないかもしれない。

Instagramで話題になっている、飼い主が犬に特定のフレーズを発するボタンを押させている動画を見たことがあるかもしれない。そこでの仮説は、動物が飼い主とのコミュニケーション方法を学んでいるということだ。しかし実際には、ペットはそれぞれのボタンが意味することを理解しているのではな く、飼い主から最も大きな反応(または確実におやつがもらえる反応)を得るためにボタンを押しているだけだろう。

首輪のShazamも、同様の問題に直面している。ペットは人間の言葉をあまり理解していない。同じように、わたしたちもペットがなぜ吠え続けているのかを常に理解できるわけではない。

「ペットと人間の絆の本当の恩恵は、人間側にあります」とマッケールは言う。「すべては人間のためのものであり、首輪に組みこまれた健康に関する機能でさえも同じです。これによって人間は、ペットがより安全で、より理解されていると感じることができるのです」

ペットを理解するのに大事なこととは

たとえ最高のチャットボットでも、たとえそれが大規模言語モデル(LLM)を活用していたとしても、実際にはあなたの言っていることを理解しているわけではない。ただ、まるで本当に理解しているかのように感じさせる応答を生成するのが非常に上手なだけだ。真似してほかの生き物にチャットボットで声を与えたとしても、ペットもその意味を理解しない。ペットは、あなたと同じくチャットボットの声を聞いても、それを自分の声、自分の意思を表しているとは解釈せず、耳元で話す別の存在の声として認識するだけである。

マッケールは、Shazamをつけた犬たちがドッグランで出会い、お互いに匂いを嗅いだり吠えたりするなか、人間の声を発するチャットボットが犬の首元でペチャクチャしゃべっている世界を想像している。一方で、クアグリオッツィは、ペットに声を与えるこのギミックが、無害だと思われがちだが実際には猫にとって有害なソーシャルメディアの動画の増加を引き起こすのではないかと懸念している。

「人々が猫を小道具やおもしろいものとして扱うことに対して、常に闘っています」とクアグリオッツィは言う。「猫を怖がらせて、トラウマになるようなことをして、その反応を“コンテンツ”にするのです。アニメ声をおもしろおかしく加えることで、事態がさらに手に負えなくなる光景が目に浮かびます」

Shazamの機能のなかで、特にペットの安全や健康に焦点を当てた機能は評価に値する。例えば、ガラガラヘビに咬まれたことを検知できれば、命を救う可能性がある。そして、もし犬が「ご飯はまだですか?」と皮肉まじりに言葉を使って飼い主に餌を促すのなら、それも役に立つだろう。しかし、犬の首にチャットボットをつけても、飼い主との絆が深まるわけではない。

ペットを理解したいという衝動は自然なものだ。しかし、ペットに自分の言語を話させるよりも、彼らのニーズを満たすためのよりよい方法があるはずだ。ペットとの最良 のコミュニケーションは、皮肉なジョークを言わせることではなく、彼らのレベルに合わせることである。

「わたしたちは常に少しずつ、何かをより高度にしたいと考えています」とクアグリオッツィは言う。「ロボットが欲しかったり、AIの仲間が欲しかったりするのと同じです。結局、人間は孤独で、つながりを求めているのです」

(Originally published on wired.com, translated by Eimi Yamamitsu, edited by Mamiko Nakano)

※『WIRED』による犬の関連記事はこちら。


Related Articles

A dog looking out a plane window to a sky with flying tennis balls
ペットと共に空を飛ぶ人は増えているが、米政府が新たに打ち出した制度により、犬連れの旅行手続きが一層複雑になっている。この状況下で、犬をメインの乗客とする新たな航空サービスが登場。混乱のなかにビジネスチャンスを見出している。
article image
人間であることには、はたしてどんな価値があるのか ── その定義がいまほど問われている時代はない。日本では未邦訳の注目の近刊『A.I. Snake Oil』や『The A.I. Mirror』を読み解きながら人間の現在地を探る、『The New Yorker』の論考。
Collage of a switchboard operator with a headset, with a set of winking eyes covering their eyes
カスタマーサービスと営業電話を担うAI音声ボットは、AIを人間にみせかける「ヒューマンウォッシング」の最新の例である。こうした慣行により、AIの透明性に関する倫理的な線引きがうやむやになっていることを、専門家は懸念している。