俺のAIデッキ(2025年5月版)

最近、生成AIサービスを契約したり、churnしたりといったことを繰り返している。その結果、自分自身が今どのサービスを、どのような目的で使っているのかが、非常に曖昧になりつつあると感じている。

そこで、一旦立ち止まり、自分のための整理も兼ねて「AIサービスデッキ」を作成してみることにした。今後、各AIサービスをどのように活用し、どれをやめて、どれに移行していくべきか。その方向性を明確にするために、現状の状況をここでまとめておこうと思う。

ChatGPT Pro

現状、間違いなくもっとも頻繁に使っているのはChatGPT。Proを解約しようかと思った矢先にo3の発表があり、そのままズルズルと課金を継続している。数週間後にはo3 pro modeのリリース予定、とアナウンスされていたのだが、現時点ではまったく続報がないため、若干信頼性に揺らぎが生じている。

ただ、実際にはo3をかなり気に入っており、基本的にはほとんどの作業をo3に任せるようになった。一方で、文章生成(例えばこのブログ記事など)をするときには、GPT-4.5を使うというような使い分けをしている状況だ。また最近はメモリー機能が進化したおかげで、予定を覚えさせるといった使い方も可能になり、ChatGPT自体の重要性はさらに高まっていると感じている。

今後、デスクトップでMCPが使えるようになると、さらに便利になりそう。Proなので、Operatorも使えるようにはなっている。ただ実際に使ってみると、最終的にはSubmitボタンを押すタイミングでConfirmが必要となる。そのため、人間が普通に作業するのとさほど変わらないというのが、正直なところである。

Claude Pro

現在、最も解約する可能性が高いのはClaudeのProである。正直なところ、このモデルの性能にはそれほど満足していないというのが率直な感想だ。もちろんエンジニアであれば、コーディングタスクを任せる際にClaudeのほうが適している場面もあるのかもしれない。しかし、自分はエンジニアではないため、Claude 3.7 SonnetのThinkingモードを含め、このモデルが特別有用だと感じる場面がないのだ。

確かに現状デスクトップアプリでMCPが使えるサービスとしてはClaudeがほぼ唯一であり、他の場合はVS CodeからRoo Code経由でMCPに接続する手法も使っている。ただ、自分の今の生活や業務の中でMCPがそこまで重要かといえば、実際にはそうでもないというのが実感だ。ObsidianのMCPも、「Obsidian Copilot」で十分代替が可能になっているため、こうした観点からもClaudeのProはchurn待ったなしである。

直近のアナウンスによれば、Claude Maxユーザー向けに「Advanced Research」のような新機能が提供されるとのことだった。しかし正直に言えば、こうした機能追加をする前に、まず本体のモデル自体の品質向上にもっとリソースを割くべきではないかと思ってしまう。

新機能でユーザーを惹きつけようとしているように見えるが、本質的なモデル性能の向上を後回しにしている印象が強く、むしろ迷走しているようにさえ感じている。

Manus Starter

最近、調査系のタスクについては、まずManusに発注するのが自分の定番となってきた。ただ、指示の出し方には独特のコツがあるようで、時に非常に表面的で浅いリサーチしか上がってこないこともあれば、期待したレベル通りのしっかりとしたリサーチが上がってくることもあり、その差がどこから生じるのかは、今後もう少し掘り下げて検証したほうが良さそうだと感じている。

実際、マーケットサイズの調査など、業務用途で利用する場合にはかなり質の高いレポートを出してくれるため、この点では全く不満はない。しかし、例えばスニーカーの価格調査のような比較的軽めの調査タスクを依頼した場合には、期待を下回る結果が返ってくることが多い。こういうタスクであれば、ChatGPTに任せても十分ではないか、と思えることもしばしばだ。おそらくManus自体にも、得意・不得意な領域が明確にあるのだろう。

また、GOROmanさんがやっているようなManusにウェブアプリを開発させて「デプロイして」と指示を出すと、本当にデプロイまで対応してくれるやつはまだ自分では試していない。近いうちにぜひ試してみようと思っているところだ。

Manusは一応まだ招待制という仕組みを採用しているようで、招待リンク経由で登録すると、追加のクレジットがもらえるようになっている。私自身もまだ4つほど招待コードを持っているので、試してみたいという方がいれば、Twitterなどで気軽に連絡していただければと思う。

Liner Pro

Linerは非常に特徴的なプロダクトで、Deep Researchをすると、その出力内容の一行一行に対して、参照元となったリソースへのリンクを細かく記載してくれるという、ある種偏執狂的とも言えるこだわりがある。

ただ、自分の主な使い方としては、むしろDeepLの代替としての利用がメインだ。Chrome拡張を通じて、ページの要約をさせたり、選択したテキスト部分を翻訳させたりという用途でよく使っている。

また課金については、公式サイト経由のドル建て課金よりも、iOS経由で円建て課金するほうが、年間でおそらく2万円近く安くなるので、課金を検討するならばiOS経由が強くお勧めだ。

使い勝手の面では、純粋にDeepLの代替として考えるとやや割高感はあるが、Deep Research用途も含めて月額2,000円程度と割り切れば、それほど不満なく利用できる価格帯と感じている。

Perplexity Pro

副回線としてLINEMOを契約している関係で1年間無料で使えるので、特別に課金をしているという感覚はないが、手軽な検索用途としてはPerplexityを使っている。ただ最近は、いきなりChatGPTで検索してしまうことも徐々に増えてきているので、このままだと御役御免になる可能性もまあまああるかもしれない。

最近のPerplexityアプリの雰囲気を見ていると、Gensparkと非常に似たような世界観を感じる。つまり、単なるAI検索ツールというよりは、キュレーションメディアに近いような、メディア的な要素を強めてきている印象だ。これはやはり、純粋なAI検索一本での勝負が難しい状況になりつつあるということなのかもしれない。

Gemini

Geminiについては、会社のGoogle Workspaceについてくる形で利用しているため、現在個人的には課金していない状態だ。ここ数週間のGeminiのアップデートは非常に目覚ましく、さすがGoogleの底力を感じさせる内容だと思っている。

現状、カスタムインストラクションのような機能がまだ実装されていないのだが、それ自体が生活の中で致命的に影響するほどの問題ではないため、Geminiを使わないということにはなっていない。ただ、自分にとってGeminiはプライマリなサービスというよりも、セカンドオピニオン的な補助的用途で使うことが多い気がする。

特に2.5ProのDeep Research機能は評判が良いようだが、自分の用途としてはまだManusのほうが十分満足できる印象である。いずれにせよ、Geminiの一番の強みはGoogleスプレッドシートGoogleドキュメント、Google Meetなどのサービスと強力に統合されている点だと思う。特にGoogleスプレッドシート内のデータを元に別の形式でデータを取り出したり加工したりする際にはGeminiが非常に役立っているので、こうした統合的なサービス展開が、今後Googleが取っていく戦略だろうなと実感しているところである。

おそらく今後Claude Proは解約する方向で考えており、その後の空いたポジションに収まるのはGeminiになりそうだと感じている。Geminiの最近の機能強化やGoogleサービスとの連携の利便性を考えると、順当にその立ち位置になるだろうと思う。

Grok

XのPremium Plusについては、単にXから広告を消すためだけに課金した結果、セットで付いてきたおまけのサービスという印象しかない。正直なところ、まったくと言っていいほど本格的に使ったことはない。

近々、大きなアップデートがあるらしいという話も耳にしているが、それについても特に期待はしていない。サービスに対して特段の感情はなく、付随的に手に入ったもの以上の意味合いは持っていない。

OpenRouter

Obsidian Copilot経由でいくつかのモデルを試すために課金している。最近試した中では、Quasar-Alphaの品質がかなり良い印象を持った。このモデルについては、まだステルス段階のため開発元がどこなのか明らかになっていないが、個人的には今後にも期待している。

また、地味に後から気づいたが、OpenRouter側でもGeminiが普通に利用できる。現状はシンプルにGoogleのAI Studio側に課金してしまっているが、OpenRouter経由で課金したほうが楽だったかもしれない。

(2025年05月13日(火) 20:17:16追記)
XでQuasar-Alphaの実態はGPT-4.1と言われている、と教えていただきました。

Obsidian Copilot

Obsidian Copilotは、各種LLMとの接続インターフェースとなるObsidianのプラグインだ。課金することで、自分のvault内に対して専用のエンベッディングモデルを利用可能になり、vaultに保存した情報を的確に検索・抽出できるようになる。

最近では「ObsidianとCursorの組み合わせ」が話題に挙がることもあるが、実際にはこのObsidian Copilotでも、ほぼ同じようなことが実現可能になっていると感じている。料金体系は月額課金も用意されているが、250ドルを一括払いのLifeTimeプランを購入した。

またDiscordのコミュニティもかなり活発で、α版のリリース情報や不具合の確認、開発状況の共有が随時行われており、自分も定期的にチェックしている。実際にまだ不具合は多少残っているものの、開発が積極的に続いているので好感が持てる。

特にComposerという既存ノートを自動で書き直す機能については、現在まだやや不安定ではあるが、これが安定して動作するようになると、生産性がさらに大きく向上するのではないかと期待しているところだ。

@GOROman

はい。サブスクしない理由がない。

Genspark (churned)

Gensparkは、Deep Researchのやり方やリサーチ結果のまとめ方などが、自分の好みに一番合っていると感じていた。ただ実際の使い勝手や結果の品質という観点からは、結局Manusのほうが優れているという結論に至り、Genspark自体のポジションが曖昧になってしまった。そのため、最終的にはあえなくchurnとなった。

最近ではスライド作成機能などを前面に押し出し、新しい方向性を打ち出しているようだが、このように各サービスがそれぞれの生存戦略を模索している様子を、やや客観的な視点で眺めているところだ。