サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
衆議院選挙2026
acro-engineer.hatenablog.com
1.はじめに こんにちはデータ分析エンジニアの木介です。 今回は2025年12月にAWSより発表された Lambda Durable Functions を使って Human-in-the-Loop なAgentの構成を紹介します。 Lambda Durable Functions を使うと、複数ステップの処理を 最大1年間 継続できます。 また、承認待ちのように処理を進められない間はLambdaの実行を一度止めた状態で待機でき、その間は実行時間として扱われません。 そのため、Human-in-the-Loop のように「数時間〜数日待つ」ワークフローでも、サーバレスのまま実装しやすくなります。 aws.amazon.com 以下のような人間の承認が必要となるようなAgentを、 Lambda Durable Functions によりサーバレス構成で実現しています。 Human-in-t
こんにちは、コバタカです。 最近はAIエージェントを使って、作って、楽しんでいます。 LLMと同様、時系列予測においても基盤モデルの活用が近年進んでいます。 今回紹介するChronos-2は、AmazonがOSSとして公開している時系列データ処理向けの基盤モデルです。 以前、本ブログでChronos-Boltの紹介がありましたが、Chronos-2はその後継モデルとなります。 様々な時系列データに対応するように学習されており、ZeroShotでも高い精度での予測が可能となっているモデルです。 この記事では、そのChronos-2について紹介していきます。 なお、Chronos-Boltの解説については以下をご覧ください。 acro-engineer.hatenablog.com Chronos-2について Chronosは予め様々な時系列を学習させておくことで、適用するデータの学習をせずと
こんにちは、丸山です。 最近、AgentCoreを利用する仕事が増え、日々いろいろな利用方法を調べています。 さて、AgentCoreは、2025年7月にプレビュー公開されて以降、10月には一般提供開始(GatewayのMCP対応/Memoryの長期記憶対応など)、12月にはさらに機能追加がされ(Evaluations/Policy)、あっという間にアップデートされていきますね。 さて今回は、AgentCore Runtime が対応している A2A(Agent2Agent)プロトコルに注目します。 A2A を利用することで、エージェント同士を標準化されたプロトコルで連携させることができます。 さらに Strands Agents には A2AClientToolProvider が追加され、 わずか数行のコードでエージェント間通信を実装できるようになっています。 本記事では、AgentC
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます。チーム紹介はこちら。 本記事は、「学習推論ライブラリ・フレームワーク Advent Calendar 2025」の25日目です。 qiita.com LLMは相変わらず新しいモデルが登場し世間を賑わせています。 しかし、モデル自体が重く、計算時間がかかります。そのため、LLMの推論では計算速度が重要となります。 「vLLM」では、LLMを効率的に推論する技術を用いて、推論の高速化を実現してきました。 ※以前、本ブログでも次の記事で「vLLM」による高速化について紹介しました。 acro-engineer.hatenablog.com 今回は「vLLM」と
こんにちは。Elasticsearchテクニカルコンサルタントの江見です。 この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の24日目の記事です。 ログの検索、売上データ、ユーザの行動履歴など、業務システムでタイムスタンプの範囲検索はほぼ必須の機能になります。 特に日単位で範囲指定をする場合は、yyyy-MM-ddのように日付のみを指定するのが人間にとっては直感的にわかりやすいと思います。 Elasticsearchで範囲検索を行う場合は、rangeクエリを使用するのが一般的ですが、yyyy-MM-ddの形式のままrangeクエリを使用した場合に 「ヒットするはずのドキュメントが返ってこない」「余分なドキュメントが返ってくる」などのケースが発生しがちです。 今回はyyyy-MM-ddでrangeクエリを使用した場合の挙動につい
こんにちは、@shin0higuchi です😊 この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025の23日目の記事です。 昨年のアドベントカレンダーでは、Elasticsearchを用いたRAGに関する記事を執筆しました。 acro-engineer.hatenablog.com この1年でElasticsearchの inference API と retriever はさらに成熟し、実戦投入しやすい状態になりました。今回は、重要要素の1つであるリランクについて、Elasticsearchで現状できることを整理します。 2つの選択肢:外部APIか、内部モデルか? Elasticsearchでリランク(Reranking)を導入する際、現在は大きく2つの選択肢があります。 現場では単純な機能比較だけではなく、コスト構造とレイテ
この記事は、以下の Advent Calendar の 18 日目における投稿です。 Japan AWS Top Engineers - Qiita Advent Calendar 2025 - Qiita AIエージェント構築&運用 - Qiita Advent Calendar 2025 - Qiita こんにちは、 YAMALEX の駿です。 今回は re:Invent で発表された Amazon Nova 2 Sonic と StrandsAgents の新機能である Bidirectional Agent を使って、 音声対話をとおして Bedrock Knowledge Base から情報を取得できるエージェントを作成しました。 Nova 2 Sonic の応答がとても速くて驚きました。 返答までの待ち時間が短く、会話としてほとんどストレスを感じません。 また、アシスタントが話
この記事は AI Agent on AWS - Qiita Advent Calendar 2025 - Qiita 16日目の記事です。 1. はじめに こんにちは。データ分析エンジニアの木介です。 Anthropic が公開した「Code execution with MCP: building more efficient AI agents」では、MCP(Model Context Protocol)とコード実行環境を組み合わせて、コンテキスト消費を抑えながらツールを使うための新しい設計パターンとして Code execution with MCP が紹介されました。 今回は、この Code execution with MCP を Amazon Bedrock AgentCore と Strands Agents で実装し、直接MCPを実行するAgent と比較して、実行時間・消
こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。 2025年12月11日(木)、東京で開催された OpenSearch Con Japan 2025 に参加してきました。 events.linuxfoundation.org 私は普段 OpenSearch/Elasticsearchなどを利用した検索サービスの開発やチューニングなどに携わっているので、今回のイベントはとても楽しみにしていました。 この記事では、イベント全体の雰囲気を簡単お伝えしつつ、 個人的に「これは実運用で効く!」と強く感じたセッションについて、少し厚めにレポートしたいと思います。 イベントの概要と雰囲気 OpenSearchは、Elasticsea
こんにちは、Elastic認定資格3種(※)を保持しているノムラです。 ※Elastic社の公式認定資格(Elastic Certified Engineer / Elastic Certified Analyst / Elastic Certified Observability Engineer) この記事は、Elastic Stack (Elasticsearch) Advent Calendar 2025 の15日目の記事です。 qiita.com 昨年公開した以下の記事の2025年版になります。 AWSでElastic Cloudを利用する 2024年版(構築編) - Taste of Tech Topics 昨年の記事執筆時点から、構築手順や設定方法、UIなどに変更が加えられており、以前の記事では最新環境に対応しづらくなってきました。 そこで本記事では、2024年版と同様に A
皆さんこんにちは。 Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。 AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます(チーム紹介は こちら )。 生成AIモデルの多くは、提供元のベンダーが学習させたものを利用するのが一般的だと思いますが(クローズドな状態)、 最近、「オープンウェイトモデル」というものが注目されています。 これは、モデルのパラメータが公開されているため、利用者が変更・調整できるもので、ファインチューニングよりも簡単に様々な環境でチューニングが可能になります。 Amazon Bedrock でも、2025/08/05に、オープンウェイトモデル(gpt-oss) が利用可能になりました。 ただ、日本語の実務でどの程度使えるか(=どの程度の精度か)は、まだまだ
こんにちは、丸山です。 2025/10/13に、Amazon Bedrock AgentCore がついに一般公開(Generally Available)となりました! もちろん、東京リージョンでも利用可能になっています。 「今年の re:Ivent に合わせて、12月ごろにGAかな」と勝手に予想していたのですが、見事に裏切られましたね。 aws.amazon.com ということで、早速、Amazon Bedrock AgentCore で、AIエージェントを開発した内容を紹介してみたいと思います。 1. はじめに 1.1 Amazon Bedrock AgentCoreとは 1.2 AgentCoreのサービス概要 1.3 概要・メリット 2. 検証アプリケーションの構成 2.1 概要 2.2 構成図 3. 実装 3.1 LambdaをGatewayを使ってMCPツールとして呼び出せる
はじめに こんにちは。データ分析エンジニアの木介です。 今回はAmazon Bedrock Knowledge BasesベクトルDB(検索エンジン)として利用できるものの比較を行っていきたいと思います。 前回はS3 VectorsとOpenSearch Serverlessの比較を行いましたが、ハイブリッド検索が必要な内容だと、精度の差が大きく出ました。 acro-engineer.hatenablog.com 現状、Bedrock Knowledge Base でハイブリッド検索に対応しているのは、以下のベクトルDBがあります。 OpenSearch Serverless OpenSearch Managed Cluster Aurora Serverless V2(PostgreSQL) MongoDB Atlas 今回、その中でも利用頻度が高いと思われる、OpenSearch Se
こんにちは、YAMALEXの駿です。 昨今、対話型AIの活用が進む中で、ユーザーごとにパーソナライズされた体験を提供することが、より重要になっています。 単なる一問一答ではなく、「ユーザーが誰で、どんな関心や目的を持っているか」を理解したうえで応答できるエージェントが求められています。 本記事では、Strands AgentsとBedrock AgentCoreを組み合わせて、ユーザーとの対話履歴を記憶・活用するパーソナライズ型エージェントの実装と検証を行います。 1. はじめに 1.1. Strands Agentsとは 1.1.1. Strands Agents Tools 1.2. Bedrock AgentCoreとは 1.2.1. AgentCore Memory 2. 検証 2.1. 構成図 2.2. 実装 2.3. 会話してみた 2.3.1. 好みを理解していない場合 2.3
こんにちは。新人エンジニアの飯棲です。 本記事ではGPT-5で新しく導入された新しいパラメータの一つであるCFGについて紹介します。 CFGはLark文法や正規表現によってモデルの回答の出力形式を制限できる便利な機能です。 1. はじめに 2. GPT-5の新機能、CFGパラメータについて 1. 何ができるか 2. 注意事項 3. 試してみる 1. 今回やること 2. Lark文法を定義する 3. CFGに設定してGPT-5を実行する 4. 色々なパターンを試す シンプルなパターン 複雑なパターン 逸脱したパターン 4. まとめ 1. はじめに GPT-5からはリクエスト時に指定できるパラメータが追加されており、モデルの出力を今までよりも細かく制御することが可能です。 cookbook.openai.com 今回はその中でも、出力のフォーマットを強制できるCFGパラメータを紹介するとともに
こんにちは、YAMALEXの駿です。 最近はStrandsAgentsとStrandsAgents Toolsを組み合わせていろいろなエージェントを作るのにはまっています。 今回は StrandsAgents と Claude 4 のインターリーブ思考 を組み合わせ、マルチエージェントなし で Deep Research 相当の調査レポートを生成する手法を紹介します。 1. はじめに 1.1. DeepResearchについて 1.2. StrandsAgentsとは インターリーブ思考とは 2. 実装 2.1. エージェント 2.2. モデル(インターリーブ思考を有効にする) ポイント 2.3. ツール(Tavily MCP) 2.3.1. Tavily MCPサーバーの特徴 2.3.2. MCP統合の実装 3. 実行 3.1. 思考プロセス 実行結果 4. ポイント 4.1. 複雑な実
こんにちは。ウィーンから日本に帰ってきたら暑すぎて体が追い付かないSsk1029Takashiです。 今回は2025/7/27~8/1にウィーンで開催されているACL2025(The 63rd Annual Meeting of the Association for Computational Linguistics)に現地参加したので、その参加報告記事になります。 聴講参加でしたが、NLPの最先端を追えた素晴らしい機会でした。 (私は日程の都合で7/31までの参加でした。) ACLとは? 学会の様子 特に気になったセッション、論文 Tutorial: Uncertainty Quantification for Large Language Models Pre$^3$: Enabling Deterministic Pushdown Automata for Faster Struc
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、AWS Summit 2025 New Yorkにて発表されたS3 Vectorsについて、既存のベクトルストレージとの比較も含めて紹介していきたいと思います。 aws.amazon.com はじめに S3 Vectorsとは 1. 他ベクトルストレージとのコスト面での比較 2. 機能面での制限事項 3. S3 Vectorsのベストプラクティス 他ベクトルストレージとの速度面での比較 他ベクトルストレージとの精度面での比較 1. ベクトル検索による精度比較 2. ハイブリッド検索との精度比較 まとめ S3 Vectorsとは AWS S3の新機能として提供されるベクトルストレージです。 S3で提供されるため、従来のAWS上で利用できたベクトルストレージであるOpenSearch Serverlessや、Auroraなどと違い
皆さんこんにちは。バックエンドエンジニアの前田です。 最近は、いよいよ暑さが本気を出してきたので、熱中症対策をしなくては、と考えています。 さて、今回はDifyのv1.0.0で追加されたReActを用いてナレッジ/記事要約エージェントを作成しました。 ナレッジに登録したドキュメントなどをもとに、Web検索もして情報を補足し、文章を要約するエージェントが欲しいと思い、作ってみました。 Difyの環境構築と基本的な使い方については以下の記事を参考にしてみてください。 今回はDifyのv1.6.0を用いて作成しました。 acro-engineer.hatenablog.com 1. DifyにおけるReActとは 2. 今回作成するアプリについて 2.1. 構成 2.2. ナレッジ検索 2.3. エージェントノード 3. 実際に動かしてみる 4. まとめ 1. DifyにおけるReActとは D
はじめに こんにちは、丸山です。 LLMやナレッジベースの利用ができるサービス「Amazon Bedrock」の新機能として、2025/04/07に「プロンプトキャッシュ」が一般公開されました。 aws.amazon.com aws.amazon.com この機能により、LLM利用時のコスト削減とレイテンシー改善ができます。 今回は、プロンプトキャッシュを使用することで実際どの程度コスト削減やレイテンシー改善ができるのか試してみました。 はじめに プロンプトキャッシュのメリット プロンプトキャッシュの仕組み ざっと知りたい人向けの説明 詳しく知りたい人向けの説明 どのようなときに使うとよいか プロンプトキャッシュを使用してみる 前提 処理内容 プロンプトキャッシュのあり/なしでの比較 プロンプトキャッシュなし プロンプトキャッシュあり 比較結果 まとめ プロンプトキャッシュのメリット 主な
はじめに こんにちは。データ分析エンジニアの木介です。 今回は、OpenSearch 3.0の最新リリースについての紹介と、新たに対応したMCP(Model Context Protocol)を用い外部リソースとOpenSearchの連携方法について解説していきます。 opensearch.org OpenSearchでのMCPの利用方法は、以下の2つの構成があります。 構成①:OpenSearchからMCPを利用する OpenSearch内でMCPクライアント/サーバーを構築し、ユーザーからの検索内容に応じてMCP経由でリソースを利用する方法。 構成➁:MCPサーバーからOpenSearchを呼び出す ユーザーがMCPクライアントを用意し、OpenSearch内で構築されたMCPサーバー経由でLLMからOpenSearch内のリソースを操作する方法。 はじめに OpenSearch 3.
こんにちは、クラウドエンジニアの青山です。 最近、何か調べたいときには、通常の検索エンジンではなく、生成AIに聞くことが習慣になってきています。 調べたいことが分かりやすく得られるので、最近の生成AIの発展には、驚くばかりです。 とはいえ、単純な検索ではなく、関係するような情報をいろいろ調べたりするのは、生成AIを使っても時間がかかりますよね。 そこで有用なのが、ユーザーの質問に対して、より広く深く考察しながら、回答をしてくれる「DeepResearch」だと思います。 いろいろな生成AIサービスで、この機能が登場してきていますが、今回この「DeepResearch」の機能を、Difyを使って実現したいと思います。 1. 概要 DeepResearchとは Difyとは 2. Dify ワークフローを使ったDeepResearchの実現 ワークフローの説明 ワークフロー中のイテレーションブ
はじめに こんにちは一史です。 先日神代植物公園に行きました、まだ藤の花が残っておりとても綺麗で癒されました。 昨今、開発支援のAIエージェントとしてClineが話題になっています。 github.com ClineはVisual Studio Code(VSCode)の拡張機能であり、単なるコード生成だけでなく、コマンド実行や動作確認・デバッグまでを一貫して行ってくれる点が特徴です。 Clineは任意の生成AIモデルを指定し、コードを生成させることができます。 このためセキュアで実際の開発現場でも活用されるAmazon Bedrockと組み合わせることでビジネスシーンでの活用も可能となります。 今回、LLMとしてBedrockを利用して、CRUD処理を行うアプリを開発できるか、TODOアプリ作成を題材に試していきます。 はじめに 概要 Clineとは? Amazon Bedrockを使う
こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。 (YAMALEXについて詳細はこちらをぜひご覧下さい。) www.acroquest.co.jp つい先日Phi-4-reasoningというモデルがMicrosoftから発表されました。 軽量な事前学習済み言語モデル(SLM)も性能が上がってきて利用されることが増えてきています。 SLM は量子化などを施すことで、ハイエンド GPU を使わずとも動かせる点が利点です。 そのため、外に出せないデータを扱ったり、通信できない環境で利用されることが多いとされています。 SLMを扱う場合に必要になるのはFine Tuningになります。 OpenAIのようなLLMとは違い、モデル自体はそこまで強力ではないため、実行させたいタスクを狭めて、そのタスク用にFine Tuningしたモデルを利用することが主流です。
こんにちは。大塚です。 AIの進化スピードに驚かされる毎日です。 生成AIだけでなく、データ活用の仕組みもどんどん進化していますね。 今回は、昨年12月にサポートされたBedrock Knowledge Basesのカスタムデータソースとドキュメントの直接取り込みAPIを試してみたいと思います! aws.amazon.com 1. はじめに 2. カスタムデータソース+直接取り込みAPIの概要とメリット カスタムコネクタとは? ドキュメントの直接取り込みとは? 3. 実際に試してみる 事前準備(ナレッジベースの作成) AWSマネジメントコンソールからドキュメントを投入 APIからドキュメントを投入 データソースからドキュメント一覧を取得 4. 制限事項の確認 サポートされていない拡張子のドキュメントを投入した場合 容量の大きいドキュメントの投入 5. まとめ 1. はじめに RAG(Ret
はじめに データ分析エンジニアの木介です。 AWSの公式ドキュメントで欲しい情報を探そうとしても、なかなか目的のページが見つからなかったりすることってありませんか? AWSから「AWS Documentation MCP Server」が公開されたため、本記事では、それを利用して、最新のAWSドキュメントに基づき、質問に回答してくれるFAQアシスタントの作成方法について紹介したいと思います。 MCP Serverの呼び出しには、Claude Desktop および dolphin-mcp を利用します。 github.com はじめに 概要 1. MCPとは MCPのしくみ 2. AWS Documentation MCP Serverとは Claude Desktop経由でAWS ドキュメントのFAQアシスタントを作成する dolphin-mcpでAWS ドキュメントのFAQアシスタント
こんにちは。データサイエンスチームYAMALEXの@Ssk1029Takashiです。 (YAMALEXについて詳細はこちらをぜひご覧下さい。) www.acroquest.co.jp MCP(Model Context Protocol)が登場して少し時間が経ちましたが、その間にMCPに対応するサービスが増え、LLM 用ツールとしてその利用も拡大しています。 ツール提供側・クライアント側のどちらのサービスも増えており、今後さらに対応が広がりそうです。 そのような中で、MicrosoftがAzure MCP ServerというAzureリソースをMCP経由で操作できるMCP Serverを公開しました。 github.com 現在は操作できるリソースは限られていますが、CosmosDBやBlob Storageなどのデータ参照などが可能です。 この記事では簡単にMCPについて説明した後、G
はじめに こんにちは、一史です。 暖かくなりベランダに出している金木犀が新芽を出してきました、春ですね。 さて、ストレージサービス間でファイル転送を実現するサービス、AWS Transfer Familyの新機能として、web appsというものがあります。 aws.amazon.com この機能を使うことで、S3のWebUIをノーコードで作成することができるようになりました。 今回はこの新機能を用いて実際にWebUIを作成し、ユーザー単位のアクセス制御が行えるかを試していきます。 はじめに AWS Transfer Family web apps とは AWS Transfer Family web appsを用いてS3 WebUI作成する WebUIの完成像 WebUIの作成 ユーザーの作成・割り当て ユーザーのファイルへのアクセス権限の設定 作成したS3 WebUIの操作 ユーザーご
こんにちは。 Acroquestのデータサイエンスチーム「YAMALEX」に所属する@shin0higuchiです😊 YAMALEXチームでは、コンペティションへの参加や自社製品開発、技術研究などに日々取り組んでいます。 はじめに 近年、RAG(Retrieval-Augmented Generation)の台頭などを背景に、ベクトル検索の重要性が増しています。 ベクトル検索は、テキストや画像などの高次元データをベクトル空間に埋め込み、類似度に基づいて検索を行う技術です。 これにより、従来のキーワード検索では捉えきれなかった、意味的な類似性に基づいた検索が可能になります。 (RAGでElasticsearchのベクトル検索を利用するやり方については、こちらの記事で紹介していますので是非ご覧ください) acro-engineer.hatenablog.com 一方で、ベクトル検索を扱うため
次のページ
このページを最初にブックマークしてみませんか?
『Taste of Tech Topics』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く