特集
画像からの文字起こしが簡単に。Copilotってこんな使い方もできたんだ!
2024年12月6日 06:06
CopilotはWindows上で最も手軽に使えるAIアシスタント機能だが、なかなか有効な使い道が見つからない、という人も少なくないと思う。でも、スクリーンショット機能を組み合わせることで意外と多くの用途で活用でき、それによってPC作業を効率化することが可能だ。今回はそんなCopilotの小ワザを紹介しよう。
コピーできないテキストはスクショしてOCR
画像内の文言や、コピー禁止の設定がされたPDF内のテキストなど、コピーして再利用したいのにそれができないケースがある。あきらめて手入力するにしても、手間がかかるうえに誤入力する危険もあるので、速度や正確性が求められるときはできるだけ避けたい手段ではないだろうか。
そんなときにCopilotを使えば、少なくとも手間を軽減することは可能だ。一番簡単なのは、PrintScreenキーを押してSnipping Toolのスクリーンショット撮影機能を起動し、コピーしたいテキスト周辺を範囲選択してCopilotのウィンドウに貼り付ける、という手順。
範囲選択した瞬間にクリップボードに画像としてコピーされ、そのままCtrl+Vで貼り付けられるので、回りくどく見える手順のわりにはすばやく作業できるはずだ。Copilotに貼り付けた後はそのままEnterで送信すれば、画像内に書かれている文言をテキスト化してくれる。確実性を期すなら「何て書いてある?」みたいに指示を添えればOKだ。
ただし、フォントによってはCopilotが誤認識する可能性もゼロではない。貼り付けた画像が小さすぎると読み取ってくれない場合があることにも注意しよう。
グラフ画像をCSV化して自在にデータ活用する
近頃はCopilotの画像認識の精度も高くなってきているため、画像からデータにする、という使い方も実用的になってきた。たとえば「グラフ画像をデータにする」のもCopilotなら可能だ。
考えられるシチュエーションとしては、なんらかの調査データにあるグラフ画像から自分なりに分析してみたいとき、あるいはそのグラフを社内向けのプレゼン資料に流用したいとき、など。画像そのままではデータとして活用しにくいし、グラフの画質やデザインを変えることもできない。そこでCopilotの出番だ。
先ほどと同じように画像をスクリーンショット撮影するか、グラフが単体の画像ファイルになっているならそれをCopilotに貼り付けて、「CSVデータにして」のように指示してみよう。ある程度数値が記載されているグラフなら正確に読み取って、CSVデータとして返してくれるはずだ。
得られたデータをCSVファイルとして保存しExcelなどで開けば、複数のグラフデータから1つのグラフにまとめることも、プレゼン資料のテイストに合わせて見栄えのするグラフにするのも自由自在。仕事のクオリティアップにもつながるだろう。
アプリの使い方やエラーの原因を知りたいときもスクショから
PC作業中は「画面の意味が分からない」なんて場面にもしばしば遭遇してしまうもの。いつでも相談できる詳しい人が近くにいればラッキーだけれど、そうでないなら自分で地道にWeb検索して調べるしかない。
しかしそんなときも、Copilotを使えばあっさり解決するはず。たとえばアプリケーションの使い方が分からないときは、そのスクリーンショットを撮ってCopilotに貼り付け、「どうやって使えばいい?」みたいに聞いてみよう。画像内の知りたい部分だけを示して、詳細に解説してもらうことも可能だ。
また、原因不明のエラーが発生したときはそのスクリーンショットをCopilotに提示すれば、問題解決の糸口がつかめることもある。もちろん、Webで(画像)検索しても同じ解決方法にたどり着ける場合もあるだろうけれど、より端的にアドバイスしてくれるのがCopilotのいいところだ。
スマホ画像に書かれている文言をPCからテキスト化
スクリーンショットからは少し離れてしまうが、Windowsだけでなく、スマホにある画像内の文言も簡単にテキスト化することが可能だ。
そのためにはまず、スマホに「Windows にリンク」アプリを、Windowsに「スマートフォン連携」アプリをインストールし、スマホとPCを連携させよう。ワイヤレスでの連携方法を含めた手順は、こちらの記事が参考になる。
スマホ連携が有効になっていると、「スマートフォン連携」アプリの「フォト」でスマホ内に保存している画像(最大2,000ファイル)を表示でき、その画像内にある文言をテキストとしてコピーできる。PC側でそれらを再利用するための作業が効率よく行なえること間違いなしだ。
「Copilotキー」を一般のキーボードでも使えるようにする
最近のノートPCには独立した「Copilotキー」が用意されていることがあり、ワンプッシュでCopilotを起動できる。これをCopilotキーがないキーボードでも使えるようにすれば、以上のようなCopilot活用がさらにはかどりそうだ。
以前は「Windows+C」キーでCopilotを呼び出すことができたが、Copilotが単独のアプリ(実際にはWebアプリ)となったあたりのタイミングで、このショートカットキーは廃止されてしまった。現在は「Windows+Shift+F23」キーというやや複雑な割り当てに変わっている。
なので、この新たなショートカットキーを1つのキーに割り当てればCopilotキーを実現できる。割り当て方法の1つは、Microsoftのユーティリティ「PowerToys」の「Keyboard Manager」を利用するもの。「キーの再マップ」で「Windows+Shift+F23」を好きなキーに割り当てられる。右Ctrlや右Altなど使用頻度の少ないキーにするのがおすすめだ。
ただし、PowerToysを常駐させていないとこのショートカットキーは有効にならない。ハードウェア的にキーカスタマイズが可能なキーボードを使っているのなら、その機能を利用するのが一番だ。「F23」(キーコード : 0x72)というやや特殊なキーを使うことになるため、対応が難しい場合もあることに注意したい。
少しの工夫でCopilotの活躍シーンは広がる
CopilotはテキストベースのチャットでWeb検索代わりに使ったり、自分だけでは思いつかないアイデアを提案してもらったり、画像生成したりといろいろな用途があるものの、それを仕事で有効に活用しようとするとなかなか難しい。
しかし少し視点を変えれば、普段はユーザー自身が手動で行なっている作業を簡略化する使い道が見つかるかもしれない。今回のようなスクリーンショットを組み合わせる使い方もそうだし、きっとほかにもCopilotが活躍してくれる場面があるだろう。もちろん今後のCopilotの進化次第で応用範囲はどんどん広がっていくはずだ。