SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

連載記事

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの書籍も豊富です。

ITエンジニアとしてのスキルアップ・リスキリングに、ぜひお役立てください。

書籍に関する記事を見る

'); googletag.cmd.push(function() { googletag.pubads().addEventListener('slotRenderEnded', function(e) { var ad_id = e.slot.getSlotElementId(); if (ad_id == 'div-gpt-ad-1659428980688-0') { var ad = $('#'+ad_id).find('iframe'); if ($(ad).width() == 728) { var ww = $(window).width(); ww = ww*0.90; var style = document.createElement("style"); document.head.appendChild( style ); var sheet = style.sheet; sheet.insertRule( "#div-gpt-ad-1659428980688-0 iframe {-moz-transform: scale("+ww/728+","+ww/728+");-moz-transform-origin: 0 0;-webkit-transform: scale("+ww/728+","+ww/728+");-webkit-transform-origin: 0 0;-o-transform: scale("+ww/728+","+ww/728+");-o-transform-origin: 0 0;-ms-transform: scale("+ww/728+","+ww/728+");-ms-transform-origin: 0 0;}", 0 ); sheet.insertRule( "#div-gpt-ad-1659428980688-0 div{ height:"+(90*ww/728)+"px;width:"+728+"px;}", 0 ); } else { if ($(window).width() < 340) { var ww = $(window).width(); ww = ww*0.875; var style = document.createElement("style"); document.head.appendChild( style ); var sheet = style.sheet; sheet.insertRule( "#div-gpt-ad-1659428980688-0 iframe {-moz-transform: scale("+ww/320+","+ww/320+");-moz-transform-origin: 0 0;-webkit-transform: scale("+ww/320+","+ww/320+");-webkit-transform-origin: 0 0;-o-transform: scale("+ww/320+","+ww/320+");-o-transform-origin: 0 0;-ms-transform: scale("+ww/320+","+ww/320+");-ms-transform-origin: 0 0;}", 0 ); sheet.insertRule( "#div-gpt-ad-1659428980688-0 div{ height:"+(180*ww/320)+"px;width:"+320+"px;}", 0 ); } } } }); }); } else { document.write('
'); document.write('
'); }
CodeZineニュース

Amazon Bedrock、ナレッジベースにおけるRAG評価とモデル評価におけるLLM-as-a-judgeをサポート

  • X ポスト
  • このエントリーをはてなブックマークに追加

  • X ポスト
  • このエントリーをはてなブックマークに追加

 米Amazon Web Servicesは、Amazon Bedrockのテスト効率化と生成AIアプリケーションの改善に役立つ、新たな評価機能となる、ナレッジベースにおけるRAG評価とモデル評価におけるLLM-as-a-judge(どちらもプレビュー)を、12月1日(現地時間)に追加している。

 Amazon BedrockのナレッジベースにおけるRAG評価では、Amazon Bedrockナレッジベースで自動ナレッジベース評価を実行して、RAG(検索拡張生成)アプリケーションを評価および最適化できるようになった。評価プロセスでは、LLM(大規模言語モデル)を使用して評価のメトリクスを計算する。RAG評価を使用することでさまざまな構成を比較し、ユースケースに必要な結果を得るために設定を調整できる。

 モデル評価におけるLLM-as-a-judgeでは、人間による評価と比較してわずかなコストと時間でテストを実行して、人間なみの品質で他のモデルを評価可能になる。

 これらの新機能が追加されたことで、AI搭載アプリケーションを高速かつ自動で評価できるようになり、フィードバックループが短縮され、改善が加速されるので、実稼働への移行を容易にする。なお、これらの評価では正確性、有用性、回答拒否や有害性といった責任あるAI基準を含む、複数の品質次元が評価される。

 ナレッジベースにおけるRAG評価は、米国東部(バージニア北部)、米国西部(オレゴン)、アジアパシフィック(ムンバイ、シドニー、東京)、カナダ(中部)、欧州(フランクフルト、アイルランド、ロンドン、パリ)、南米(サンパウロ)のAWSリージョンにて、プレビュー提供されている。

 モデル評価におけるLLM-as-a-judgeは、米国東部(バージニア北部)、米国西部(オレゴン)、アジアパシフィック(ムンバイ、ソウル、シドニー、東京)、カナダ(中部)、欧州(フランクフルト、アイルランド、ロンドン、パリ、チューリッヒ)、南米(サンパウロ)のAWSリージョンにて、プレビュー提供されている。

 ナレッジベースにおけるRAG評価、モデル評価におけるLLM-as-a-judgeで利用可能な評価モデルは、AWSリージョンによって異なる。

 料金は、Amazon Bedrockにおけるモデル推論の標準的な料金に準拠しており、評価ジョブ自体には追加料金は発生しない。評価モデルと評価対象モデルは、通常のオンデマンドまたはプロビジョニングされた料金に従って課金される。

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
この記事の著者

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/20682 2024/12/21 12:00
" ); }

おすすめ

アクセスランキング

  1. 1
    オープンソーステキストエディタ「Emacs 30.1」リリース NEW
  2. 2
    C++からRustに移行した「Fish Shell 4.0」、正式リリース NEW
  3. 3
    【超時短テクニカルライティング】生成AIを活用しながら文章を見直して、よりわかりやすい文章にしよう
  4. 4
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  5. 5
    「Developers Summit 2025」講演スライド・参加ブログまとめ
  1. 6
    未経験からエンジニア転職後の年収は増額傾向にあり、アクサスが「エンジニア×転職後の年収」を調査 NEW
  2. 7
    さくらインターネット、キヤノンITソリューションズと開発した暗号化消去対応フォーム「Cipher-X」の提供を開始 NEW
  3. 8
    クロスプラットフォームフレームワーク「Lynx」がオープンソースで公開 NEW
  4. 9
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  5. 10
    ITエンジニアの技術力で事業に貢献! 「アーキテクチャ・設計」に関する講演スライドまとめ【デブサミ2025】

アクセスランキング

  1. 1
    オープンソーステキストエディタ「Emacs 30.1」リリース NEW
  2. 2
    C++からRustに移行した「Fish Shell 4.0」、正式リリース NEW
  3. 3
    【超時短テクニカルライティング】生成AIを活用しながら文章を見直して、よりわかりやすい文章にしよう
  4. 4
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  5. 5
    「Developers Summit 2025」講演スライド・参加ブログまとめ
  6. 6
    未経験からエンジニア転職後の年収は増額傾向にあり、アクサスが「エンジニア×転職後の年収」を調査 NEW
  7. 7
    さくらインターネット、キヤノンITソリューションズと開発した暗号化消去対応フォーム「Cipher-X」の提供を開始 NEW
  8. 8
    クロスプラットフォームフレームワーク「Lynx」がオープンソースで公開 NEW
  9. 9
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  10. 10
    ITエンジニアの技術力で事業に貢献! 「アーキテクチャ・設計」に関する講演スライドまとめ【デブサミ2025】
  1. 1
    ITエンジニア本大賞2025、技術書部門とビジネス書部門の大賞が決定!
  2. 2
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  3. 3
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  4. 4
    マイクロソフト、VSCodeの新機能「Copilot Next Edit Suggestions」のプレビュー版公開
  5. 5
    3/5まで書籍全文が無料公開 『Pythonで動かして学ぶ!Kaggleデータ分析入門』
  6. 6
    AIや統計の数式を解説する美少女VTuber「AIcia Solid Project」生みの親が語る、継続できるアウトプット活動とは?
  7. 7
    Linuxディストリビューション「EndeavourOS Mercury」が一般提供開始
  8. 8
    ITエンジニア本大賞2025のプレゼン大会をレポート、最終決戦に臨んだ本に込められた想いとは
  9. 9
    開発者のOSS活動が会社から評価される世の中にしたい──日立製作所が専門組織設立に込めた情熱
  10. 10
    GitHub、あらゆるエディタやIDEとGitHub Copilotとの統合を可能にする「Copilot Language Server SDK」を一般公開

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

メールバックナンバー

アクセスランキング

  1. 1
    オープンソーステキストエディタ「Emacs 30.1」リリース NEW
  2. 2
    C++からRustに移行した「Fish Shell 4.0」、正式リリース NEW
  3. 3
    【超時短テクニカルライティング】生成AIを活用しながら文章を見直して、よりわかりやすい文章にしよう
  4. 4
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  5. 5
    「Developers Summit 2025」講演スライド・参加ブログまとめ
  1. 6
    未経験からエンジニア転職後の年収は増額傾向にあり、アクサスが「エンジニア×転職後の年収」を調査 NEW
  2. 7
    さくらインターネット、キヤノンITソリューションズと開発した暗号化消去対応フォーム「Cipher-X」の提供を開始 NEW
  3. 8
    クロスプラットフォームフレームワーク「Lynx」がオープンソースで公開 NEW
  4. 9
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  5. 10
    ITエンジニアの技術力で事業に貢献! 「アーキテクチャ・設計」に関する講演スライドまとめ【デブサミ2025】

アクセスランキング

  1. 1
    オープンソーステキストエディタ「Emacs 30.1」リリース NEW
  2. 2
    C++からRustに移行した「Fish Shell 4.0」、正式リリース NEW
  3. 3
    【超時短テクニカルライティング】生成AIを活用しながら文章を見直して、よりわかりやすい文章にしよう
  4. 4
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  5. 5
    「Developers Summit 2025」講演スライド・参加ブログまとめ
  6. 6
    未経験からエンジニア転職後の年収は増額傾向にあり、アクサスが「エンジニア×転職後の年収」を調査 NEW
  7. 7
    さくらインターネット、キヤノンITソリューションズと開発した暗号化消去対応フォーム「Cipher-X」の提供を開始 NEW
  8. 8
    クロスプラットフォームフレームワーク「Lynx」がオープンソースで公開 NEW
  9. 9
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  10. 10
    ITエンジニアの技術力で事業に貢献! 「アーキテクチャ・設計」に関する講演スライドまとめ【デブサミ2025】
  1. 1
    ITエンジニア本大賞2025、技術書部門とビジネス書部門の大賞が決定!
  2. 2
    「オブザーバー・パターン」 ~マンガでプログラミング用語解説
  3. 3
    C# 13の新機能を理解する――暗黙的なインデックスアクセスとallows ref struct
  4. 4
    マイクロソフト、VSCodeの新機能「Copilot Next Edit Suggestions」のプレビュー版公開
  5. 5
    3/5まで書籍全文が無料公開 『Pythonで動かして学ぶ!Kaggleデータ分析入門』
  6. 6
    AIや統計の数式を解説する美少女VTuber「AIcia Solid Project」生みの親が語る、継続できるアウトプット活動とは?
  7. 7
    Linuxディストリビューション「EndeavourOS Mercury」が一般提供開始
  8. 8
    ITエンジニア本大賞2025のプレゼン大会をレポート、最終決戦に臨んだ本に込められた想いとは
  9. 9
    開発者のOSS活動が会社から評価される世の中にしたい──日立製作所が専門組織設立に込めた情熱
  10. 10
    GitHub、あらゆるエディタやIDEとGitHub Copilotとの統合を可能にする「Copilot Language Server SDK」を一般公開