サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
衆議院選挙2026
weel.co.jp
2D画像やテキストから高精度な3D空間を自動生成できるAIツール Webベースで直感的に操作可能、専門知識不要で幅広い業種に対応 Pro以上のプランで商用利用が可能、リアルな空間理解と出力に強み 現実空間をそのままデジタルに再現できたら、仕事や学びはどれだけ変わるのか…気になりませんか? AIが発展してきたとはいえ、これまでのツールには「空間認識」や「現実とのつながり」という弱点がありました。そんな中、新たに登場したのが 「Marble(マーブル)」です。 Introducing Marble by World Labs: a foundation for a spatially intelligent future. Create your world at https://t.co/V267VJu1H9 pic.twitter.com/T00mtETmCA — World Labs (
ローカル構築により、プロンプトや生成枚数の制限がなく自由な画像生成が可能 GUI対応のAUTOMATIC1111 Web UIで、プログラミング不要の簡単操作を実現 拡張機能や学習モデルの追加が自在で、高度なカスタマイズにも対応 Stable Diffusionは、写真のようにリアルな画像を生成したり、高画質なアニメ画像を誰でも短時間で作成できるAIサービスです。 しかし、構築する環境によって使い勝手が違うのはご存じでしょうか。 構築方法はいくつかありますが、Stable Diffusionをしっかり使いたい人は、ローカルでの環境構築が非常におすすめです! この記事では、Stable Diffusionをローカルで環境構築するメリットやデメリット、インストール方法を詳しく解説していきます。環境構築は手順を間違えると、一からやり直しになる場合もあるため、注意して行わなければなりません。ぜひ、
自然な視点変更&カメラワークに対応 スタイルや構図、照明設定など、生成画像の精度を高めるコツが満載 商用利用OK!動画に透かしも入らない(有料プラン) 動画制作に革命が来た…!? Runwayが新たに発表した「Gen-4」をご存知ですか?Runway Gen-4は、AI技術を駆使して、これまで以上にリアルで一貫性のある映像生成を可能にしました。 このAIツールは、クリエイターや企業にとってどのような可能性を秘めているのか?気になりますよね…! この記事では、Runway Gen-4の特徴や使い方、料金プランから注意点まで、詳しく解説します。ぜひ最後までご覧ください。
Playwright MCPの概要 MicrosoftがリリースしたPlaywright MCPは、LLMがWebブラウザを操作できるようにするためのツールです。Playwright MCPはスクリーンショットや視覚モデルに頼らず、playwrightのアクセシビリティツリーを利用して、Webページの内容を理解しています。 「playwrightのアクセシビリティツリーを利用して」というのは、画面上の見た目ではなく、Webページの「構造」を理解して操作するということです。 アクセシビリティ(A11y)ツリー Webページには視覚障がい者の方などが使う「アクセシビリティ(A11y)ツリー」という仕組みがあります。この仕組みは人間が意味を持って見る要素を、機械が読み取れる形式で表現したものです。 アクセシビリティ(A11y)ツリーを使うことにより、UIが変わっても操作ができたり、テキストベース
ブラウザだけで使えるクラウド型開発基盤で、AI補完やReplit Agentにより開発を高速化 段階的な料金プランがあり、個人利用からチーム・会社全体の導入まで扱いやすい RoktやZinusなどの事例のように、社内ツール開発のコスト削減とリードタイム短縮に貢献している 皆様、Replitをご利用になったことはありますか? 社内システムの内製化や、AIを活用した業務アプリ開発をどう進めるか、多くの企業の情報システム部門が直面しているテーマです。Replit(リプリット)は、ブラウザだけで開発からデプロイまで完結できるクラウド型の開発基盤として、そうした課題に応える選択肢のひとつです。 本記事では、Replitの基本的な仕組みと主な特徴、料金プラン、最新アップデート、そして実際の企業活用事例や注意点までを、情シス担当者の視点から整理して解説します。 このツールは、企業の開発効率を飛躍的に向上
Introducing Agent Workflows. A visual editor for designing conversation flows in Agents Platform. Instead of building all of your business logic in a single agent, Workflows enable you to handle more complex scenarios by routing to specialized Subagents. pic.twitter.com/p8SYZxoN8k — ElevenLabs (@elevenlabsio) October 6, 2025 ElevenLabsはこれまで「自然な音声を作るAI」として知られていましたが、Agent Workflowsによって、「話すAI」から「動かすA
Manusはユーザーの「思考」を「行動」に変える自律型AIで、指示から計画と実行、成果物提供までを一貫して行います。旅行プランの作成や株式分析レポートの生成など、日常生活からビジネスまで、幅広いタスクに対応できるとのこと。 本記事では、そんな「Manus」の概要から使い方までご説明します。ぜひ、最後までご覧ください。 Manusとは?その概要と注目される理由 「Manus」は、季逸超(Ji “Peak” Yichao)氏を中心とする開発チームにより開発され、季氏は、「Manusは世界初の真の汎用AIエージェントであり、単なるチャットボットではなく、構想から実行まで橋渡しする次世代のAIだ」と述べています。 招待制のウェブプレビュー版が公開されると同時に、中国のAIコミュニティで大きな注目を集めました。その背景には、高い性能を裏付ける実績があります。 Manusリリース当初は招待制でしたが、
Claude 3.7 Sonnetの概要 Claude 3.7 SonnetはAnthropicが新たにリリースしたLLMです。従来のモデルに比べてClaude 3.7 Sonnetは安全性と性能を追求したハイブリッド型のモデルになっています。 トレーニングデータは2024年11月までにインターネット上で公開されている情報と、第三者からの非公開情報、データラベリングサービス、内部で生成されたデータを使ってトレーニングされており、RLHFやConstitutional AIを使って人の価値判断に沿った応答を学習しています。 Reinforcement Learning from Human Feedback:RLHF RLHFは人間のフィードバックからの強化学習を意味するものであり、この手法は人の価値判断に沿うようにAIモデルを強化学習によってファインチューニングする技術です。 RLHFの例
ローカル環境でLLM推論ができる「Ollama」を使ってみた!その実力を徹底解説! 2025 1/07 「ローカル環境で手軽にLLM推論したい」「機密性の高いデータを保護しつつ高度な言語処理したい」などの悩みを一度でも持たれたことがある方、その悩みを解決するツール「Ollama」についてご説明します! 「Ollama」はllama.cppをバックエンドにしたオープンソースソフトウェア(OSS)です。 しかも、外部サーバーに依存することなく、ローカル環境で高度な言語処理ができるとのこと。つまり、「Ollama」はLLM推論を高速かつユーザーフレンドリーな形で利用できちゃうんです! そんな「Ollama」について本記事で徹底解説しますので、ぜひ最後までご覧ください! Ollamaとは? 「Ollama」は、2023年8月にリリースされ、ローカル環境でも高度なLLM推論ができる点が強みのオープン
VSCodeやCursorで機能するAIエージェント型拡張機能 導入ハードルは低く、AIエージェントに詳しくなくても導入可能 たった数分でWebアプリの開発が可能 2024年には多くのLLMがリリースされました。大規模言語モデルと言われる中、小型のモデルでも大規模言語モデルと同等の性能を発揮できるものが開発され、高性能な大規模言語モデルという流行から高性能な小型なモデルという流れに変わってきていると感じます。 いくつものLLMがリリースされる中、AIエージェントと呼ばれるものもリリースがされ始め、2024年11月12月に公開されたBrowser Useのインパクトが大きかったのではないでしょうか。 Cline+DeepSeek-V3、もう試しましたか? DeepSeek-V3はGPT-4oと同等がそれ以上で2月までは10倍以上安い。 私は基本Cursorを使っていますがCline+Deep
ウェブ要素の抽出 ボタンやリンクなどの要素の認識と操作。視覚情報とHTML構造を統合してウェブページを理解する。 自動化機能 複数タブの同時管理。クリックされたボタンなどの要素の追跡と再利用可能な操作履歴(XPath抽出)。 カスタム可能性 ファイル保存、データベース操作、通知などオリジナルアクションの追加。ヘッドレスモード、セキュリティ無効化などブラウザ設定のカスタマイズも可能。 堅牢性と効率性 自動でエラーの修正も可能。並列エージェントの実行による処理効率向上。 AIモデルとの互換性 GPT-4、Claude 3、Llama 2など、多様なLLMと連携可能。LangChainフレームワークのサポート。 その他 匿名の使用データ収集による機能改善(オプトアウト可能)。 Browser Useでできること Browser Useはウェブページ上のボタンやリンク、フォームなどの要素を自動的に
SynthIDの概要 参考:SynthID SynthIDは、Google DeepMindが開発し、Google Researchと提携して改良したAIツールです。このツールは、AIが生成した画像や音声などのコンテンツに電子透かしを埋め込む機能が備わっており、そのコンテンツがAIによって生成されたことを証明するのに役立ちます。 さらに、電子透かしが人間の視覚や聴覚に影響を与えることはないので、コンテンツの視聴体験を損なうこともありません。AIによって生成されたコンテンツを見極められるようになると、責任の所在が明確になるほか、情報の信頼性を高める効果が期待できます。 なお、生成AIを開発するリスクについて詳しく知りたい方は、下記の記事を合わせてご確認ください。 SynthIDに実装された2つの深層学習モデル 参考:SynthID SynthIDには、以下2種類の深層学習モデルが実装されてい
自社専用のCopilotを構築できる ローコード対応のAI開発プラットフォーム 生成AIや自社データ連携に対応し、業務効率化や自律エージェント構築が可能 日本語を含め複数言語に対応している Microsoftは2023年11月から、「Microsoft Copilot Studio」が日本でも利用できるようになりました。Microsoft Copilot Studioとは、Microsoft365向けの、独自にCopilotをカスタマイズできる会話型のAIプラットフォームです。Copilot Studioを使用すると、業界や部署などを超えて特定のニーズに合ったCopilot(コパイロット)を簡単に作ることができます。 つまり、Microsoft Copilot Studioはあなた専用の人工知能の助手を作るための開発環境ということですね。映画「アイアンマン」におけるジャービスのようなAIア
画像生成AIを試してみたけど、思った通りの画像ができなくて悩んだことはありませんか? 最新モデルStable Diffusion 3.5の「プロンプトガイド」を活用すれば、思い描いたイメージを高精度に再現できます! プロンプト次第でリアルな写真風、ファンタジーイラスト、さらには芸術作品風の画像も自在に作成可能です。
Anthropicが開発したGoogle Drive、Slack、GitHub、Postgresなどのデータソースやツールを効率的に連携させる仕組み 普遍性とオープン性、双方向接続、安全性、拡張性の4つを備え、従来の個別API開発の手間を省き、統一されたプロトコルで接続可能 サービス間の文脈を維持しながら効率的にデータを扱える点が魅力。Claude for Desktopだけでなく、VS Codeのエージェントモードなど主要開発環境がMCPのフル仕様(認可・リソース・サンプリング等)を実装 2024年11月の公開以降、AnthropicのModel Context Protocol(MCP)は「AI×外部ツール連携」の事実上の共通のレイヤーとして急速に広がっています。 現在は公式サイト/仕様/SDK/多数のサーバーが整備され、VS CodeのエージェントモードでもMCPがフル対応となりまし
Difyはローカル環境でも動かせる! まずは、ローカル環境でもAIツールを作って動かせる「Dify」の概要をご紹介します。以下、詳しくみていきましょう! そもそも「Dify」とは? 「Dify(ディファイ)」は、アメリカのLangGenius社が提供するオープンソースのAIアプリ開発プラットフォーム。こちらはなんとノーコードで、RAG搭載のチャットボットやAIエージェント、画像生成AIアプリ等が作れてしまう優れものです。(※1、2) そんなDifyの詳しい魅力・すごいところは、というと…… プロンプトやフローチャートを駆使することで、AIツールのノーコード開発が可能 OpenAIやAnthropicのAPIからOllamaのローカルLLMまで、数百種類のLLMと簡単に連携可 Langchainや各種データベース不要でRAGチャットボットが作成可 Webアプリ版とローカル版の両方が利用可能
Replitとは Replit みなさんは、プログラミングを始めようとして環境構築に手こずった経験はありませんか?ブラウザがあれば、すぐにコーディングを始められる開発環境があったら素敵ですよね。 そんな願いを叶えてくれるのが、オンライン開発環境「Replit」です。 Python、JavaScript、Rubyといった50種類以上のプログラミング言語に対応していて、インストール作業なしですぐにコーディングを始められます。チームメンバーと一緒に画面を共有しながら開発できるのも魅力的です。 なお、Replitについて詳しく知りたい方は、下記の記事を合わせてご確認ください。 Replit Agentについて 2024年9月、Replitに革新的な機能が加わりました。それが「Replit Agent」です。このAI開発支援ツールの登場により、アプリケーション開発の世界が大きく変わろうとしています。
Stable Diffusionを使えば、写真のようにリアルな画像を生成したり、高画質なアニメ画像を誰でも短時間で作成できるAIサービスですが、構築する環境によって使い勝手が違うのはご存じでしょうか。 構築の方法はいくつかありますが、Stable Diffusionをしっかり使いたい人は、ローカルでの環境構築が非常におすすめです! この記事では、Stable Diffusionをローカルで環境構築するメリットやデメリット、インストール方法を詳しく解説していきます。環境構築は手順を間違えると、一からやり直しになる場合もあるため、注意して行わなければなりません。ぜひ、この記事を最後までお読みください。 Stable Diffusionとは? Stable Diffusionとは、誰でも無料で使える画像生成AIのことを指します。2022年8月に公開され、テキストや簡単な線画を入力するだけで高解像
WEELメディア事業部AIライターの2scです。 みなさん!2024年9月12日に登場したOpenAI最新のLLM「OpenAI o1-preview」がアップデートを受け、完全版の「OpenAI o1」になりました! このOpenAI o1は、専門家顔負けの数学力&理数科目の知識量を持っていて、o1-previewよりも速く回答生成が可能です。しかも、画像の入力にも完全対応しています! OpenAI o1 is now out of preview in ChatGPT. What’s changed since the preview? A faster, more powerful reasoning model that’s better at coding, math & writing. o1 now also supports image uploads, allowing
kotaemonの使い方 ここからは実際にkotaemonを使っていきます。 GitHubではDockerの使用が推奨されていますが、利用者が多いであろうgoogle colaboratoryで実装していきたいと思います。 kotaemonを動かすのに必要な動作環境 kotaemonを実行した時の環境は以下です。google colaboratoryで実装する場合にはランタイムをGPUに変更する必要があります。 kotaemonの実行ではそこまでGPUを使わないため、無料プランでも十分利用できます。 ■Pythonのバージョン Python 3.10以上 ■使用ディスク量 34.2GB ■システムRAMの使用量 2.8GB ngrokのtoken取得 kotaemonをgoogle colaboratoryで実行するためには、ngrokのtokenが必要になるので、実装する前にngrokの
DifyはLLMを活用し、AIアプリ開発をノーコードで簡素化できるオープンソースプラットフォーム テンプレート・ナレッジ・ツール連携など豊富な機能で業務効率化を支援 無料で始められ、日本語対応や商用利用にも対応する柔軟な環境 生成AIの技術や社会的な認知度が向上して業務への実装例が多くなってきました。自社の業務にAIを使用し、効率化してみたいという要望も多いでしょう。 Difyは、米LangGenius, Inc.が提供している大規模言語モデル(LLM)を使ったAIアプリケーションの開発と運用を簡素化するオープンソースプラットフォームです。 RAGを使用したチャットボットやAIエージェント、ドラッグ&ドロップインターフェースを使用したAIアプリ開発ワークフローをノーコードで構築できます。 今回は、Githubで10万以上のスター(2025年5月時点)を獲得するほど大注目を集めているDify
2024年8月1日、「FLUX.1」という新たな画像生成AIが発表されました! FLUX.1は「Stable Diffusion」の開発者たちが新たに立ち上げた会社「Black Forest Labs」が、新たに開発した画像生成AIです。FLUX.1の強みは、プロンプトの指示に忠実に従ってくれ、画像中に文字も入れられる点。 Black Forest LabsがFLUX.1を発表したXのポストは30万人以上の方々が見ており、非常に関心の高い画像生成AIであることがわかります。 Today we release the FLUX.1 suite of models that push the frontiers of text-to-image synthesis. read more at https://t.co/49zTUK8Q5V pic.twitter.com/hmcKRIlizn
プロット 漫画の基盤となるのが「プロット」です。物語のテーマや起承転結、キャラクターの関係性など、物語の軸を整理するフェーズです。 おすすめツール:ChatGPT、AI BunCho ポイント:ChatGPTなら「恋愛 × 幼馴染 × 夏祭り」などテーマを与えるだけで、緻密なプロットを生成できます。AI BunChoは日本語特化型のプロット補助ツール。いずれも無料から利用可能で、プロのネーム構成のベースとしても役立ちます。 台本 プロットをもとに、セリフやナレーションを文章化していきます。各コマの展開やキャラの話し方が自然になるように整えることがポイントです。 おすすめツール:ChatGPT、AI BunCho ポイント:AIでベースとなる台本を生成した後、自分でリライトするのが基本。ナレーション用の文章を整えておけば、次の音声生成工程もスムーズに進みます。 イラスト セリフに合ったシーン
WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868
テキストor画像から3Dモデルが作れる生成AIが登場 近年では、人工知能を駆使して、単純なテキストや1枚の画像から3Dモデルを生成できる生成AIが登場しています。元々、3Dモデルを作成するには専門家が多くの時間をかける必要があったため、これは大きな変革です。 とくに、映像制作やゲーム開発の業界で注目されているのが特徴。3Dモデル生成AIを使えば誰でも3Dモデルを簡単に作れるほか、効率的に作成できるのがメリットです。多くの企業が導入し始めているので、気になる方は実際に使ってみてください。 3Dモデル生成のText to 3D・Image to 3D・Video to 3Dの違い 生成AIを使った3Dモデル作成には、入力形式に応じて「Text to 3D」「Image to 3D」「Video to 3D」という3つの主要アプローチがあります。それぞれの特徴と用途の違いは、以下の通りです。 方
Stable DiffusionのAUTOMATIC1111とは?概要や導入方法を徹底解説 2024 4/11 Stable Diffusionは簡単に画像を生成できるAIツールですが、Web UIをうまくダウンロードできず迷う方は多いと思います。Stable DiffusionにはForge版とAUTOMATIC1111版があり、違いがわかりにくくダウンロード方法も複雑です。 今回は、Stable DiffusionのWeb UIであるAUTOMATIC1111について紹介します。推奨スペックや導入方法、実際の画像生成の方法までまとめていますので、ぜひ参考にしてください。 Stable Diffusion web UI (AUTOMATIC1111) とは Stable DIffusion Web UI(AUTOMATIC1111)とは、ブラウザで簡単に使用できる画像生成AIです。無料の
WEELメディア事業部AIライターの2scです。 みなさん、各種文書の引用機能「RAG」を備えた生成AIチャットボットにはNGがあります。 それは……「文書をそのまま読み込ませる」ということです。実はRAGの場合、読み込ませる文書に「前処理」を施す必要があります。前処理なしだと、正しく引用が行われなかったり、ハルシネーションが生じたりしてしまうんです。 ということで今回は、RAGの前処理について、その効果や手法をお伝えします。さらに、RAGの精度を高めるTipsも紹介!完読いただくと「かしこいチャットボット」が作れるかも……です。 ぜひ、最後までお読みください。 RAGにおける「前処理」とは? LLM(大規模言語モデル)に学習範囲外の知識・事実を示す手法「RAG / Retrieval Augmented Generation」は、企業用チャットボットの開発に不可欠。そのしくみは下図のとお
「DALL-E3」搭載のBing Image Creatorとは? 「Bing Image Creator」は、Microsoftが提供する画像生成AIツールです。ユーザーが入力したプロンプトに基づいてAI画像を生成します。作成したい画像をイメージしたプロンプトを入力すれば、文章に合った画像が最大4枚作成されます。 Bing Image Creatorは、OpenAIの最新の画像生成モデルである「DALL-E 3」を搭載。DALL-E2の後継バージョンである「DALL-E 3」は、ニュアンスを理解する能力が大幅に向上しています。プロンプトに忠実でハイクオリティな画像を生成できる点が特徴です。 なお、DALL-E 3の活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。 Bing Image Creatorの特徴 Bing Image Creatorには、DALL-E3を
NotebookLMとは NotebookLMとは、Googleが開発した生成AIを活用してユーザーの思考を支援する新しい情報整理ツールです。実験的なサービスとしてスタートしたNotebookLMですが、2024年9月18日に正式版がリリースされ、より安定した機能が提供されるようになりました。 従来のノートアプリとは異なり、アップロードされたドキュメントの内容を深く理解し、「AIコラボレーター」として機能します。 以下で、正式版NotebookLMの概要を各項目に分けて詳しく解説します。 Gemini 2.5 Flashを搭載 2025年7月11日時点でのNotebookLMには、Googleが開発した大規模言語モデル(LLM)「Gemini 2.5 Flash」が搭載されています。こちらは高速回答ができるFlashモデルでありながら、熟考して回答を生成する「推論モデル(Flash初)」で
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く