-
Conversational AI / NLPMegatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発
-
Data Center / Cloud / EdgeNVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化
-
Generative AI先進的なソブリン AI モデルが、日本のイノベーションとチャンスを解き放つ
-
Conversational AI / NLP高速化された Llama 3.2 をエッジからクラウドへデプロイする
-
Generative AINeMo Curator を使った日本語データのキュレーション
最近の投稿
2024 年 12 月 17 日
NeMo Curator を使った日本語テキスト データのドメイン分類
NeMo Curator は、日本のソブリン LLM の構築や更新のためのデータセットを準備するために、日本語をサポートする多言語ドメイン分類器をリリースしました。
3 MIN READ
2024 年 12 月 11 日
NVIDIA AI Blueprint でカスタマー サービス向けの AI バーチャル アシスタントを作成する 3 つの構成要素
NIM と NeMo™ Retriever を活用したリファレンス アプリケーションである NVIDIA NIM™ AI Blueprint を使用して、あらゆる業界のカスタマー サービスを変革しましょう。
2 MIN READ
2024 年 11 月 21 日
NVIDIA NIM でファインチューニングされた AI モデルのデプロイ
パフォーマンスを最適化した TensorRT-LLM 推論エンジンをローカルでビルドして、SFT でカスタマイズされたモデルに対する NIM マイクロサービスを迅速にデプロイする方法を説明します。
2 MIN READ
2024 年 11 月 13 日
LLM テクニックの習得: データの前処理
LLM の精度向上におけるデータ品質は重要であり、さまざまなデータ処理手法があります。NeMo Curator を利用して今すぐ課題に対処してみましょう。
2 MIN READ
2024 年 11 月 13 日
2D と 3D のデジタル ヒューマン アバターによる AI エージェント インターフェイス オプションの拡張
さまざまなユース ケースに合わせてカスタマイズすることができる、カスタマー サービス向けデジタル ヒューマンの NVIDIA AI Blueprint は、リアルなデジタル ヒューマンの作成を始めるのに最適です。
2 MIN READ
2024 年 11 月 11 日
Megatron-LM を用いた日本語に強い 172B 大規模言語モデルの開発
日本のモデル開発を促進するためのプロジェクトである GENIAC に採択された LLM-jp が、NVIDIA Megatron-LM を使用して、日本語に強い 172B オープンモデルの学習を高速化しました。
2 MIN READ
2024 年 11 月 8 日
NeMo Framework で日本語 LLM をファインチューニング - DPO 編 -
NeMo Framework を使用して、日本語の大規模言語モデル (LLM) で、人間の嗜好や価値観に沿うようにモデルを調整するアライメント手法の一つである、DPO (Direct Preference Optimization) を実行する方法を説明します。
4 MIN READ
2024 年 11 月 4 日
NVIDIA AI Workbench によるハイブリッド環境におけるスムーズなコラボレーションと迅速なプロトタイピング
データ サイエンス、AI、機械学習などのプロジェクトを合理化する無料の開発環境マネージャー「NVIDIA AI Workbench」の、最新リリースでの主要な新機能とユーザーから要望のあった更新についてご紹介します。
3 MIN READ
2024 年 10 月 31 日
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
NVIDIA NIM マイクロサービスを使用すれば、高度なビジュアル AI エージェントの構築がこれまで以上に簡単で効率的になります。
3 MIN READ
2024 年 10 月 28 日
NVIDIA GH200 Superchip が、Llama モデルとのマルチターン インタラクションの推論を 2 倍高速化
NVIDIA GH200 Grace Hopper Superchip を活用し、システム スループットを犠牲にすることなく、x86 ベースの NVIDIA H100 サーバーと比較して、Llama 3 70B モデルでマルチターンでユーザーとのやり取りする場合、TTFT を最大 2 倍に向上させる方法について解説します。
2 MIN READ
2024 年 10 月 16 日
NeMo Guardrails により LLM の脆弱性を防ぐ: 導入編
プログラム可能なガードレールを LLM ベースの対話システムに簡単に追加するための OSS 機能である NeMo Guardrails の詳細や導入方法を解説します。
3 MIN READ
2024 年 10 月 16 日
NeMo Guardrails により LLM の脆弱性を防ぐ: ジェイルブレイク防止編
LLM ベースの対話型アプリケーションにガードレールを追加するオープン ソースのツールキット「NeMo Guardrails」の Input Rails を用いたジェイルブレイク防止のチュートリアルを試します。
8 MIN READ
おすすめ
2024 年 10 月 31 日
NVIDIA NIM によるマルチモーダル ビジュアル AI エージェントの構築
NVIDIA NIM マイクロサービスを使用すれば、高度なビジュアル AI エージェントの構築がこれまで以上に簡単で効率的になります。
3 MIN READ
2024 年 10 月 8 日
NVIDIA cuOpt で大規模な線形計画問題を加速する
NVIDIA cuOpt は現在、GPU アクセラレーションで PDLP を実装しています。最先端のアルゴリズム、NVIDIA ハードウェア、専用の CUDA 機能、NVIDIA GPU ライブラリを使用して、cuOpt LP ソルバーは、CPU ベースのソルバーと比較して 5,000 倍以上の高速パフォーマンスを実現しています。
3 MIN READ
2024 年 9 月 30 日
NVIDIA NIM Operator で Kubernetes の AI 推論パイプラインを管理
NIM Operator を使用すれば、わずか数回のクリックまたはコマンドで、NVIDIA NIM マイクロサービスのデプロイ、オートスケーリング、ライフサイクルを管理することができます。
2 MIN READ
2024 年 9 月 25 日
高速化された Llama 3.2 をエッジからクラウドへデプロイする
NVIDIA のアクセラレーテッド コンピューティング プラットフォームと組み合わせることで、Llama 3.2 は開発者、研究者、企業に、生成 AI のユース ケースを実現するための有益な新機能と最適化を提供します。
2 MIN READ
2024 年 9 月 23 日
Llama-3.1-Nemotron-51B による精度と効率の前進
NVIDIA は、比類のない精度と効率を実現する独自の言語モデル、Llama 3.1-Nemotron-51B を発表しました。 Meta の Llama-3.1-70B の派生モデルであり、新しい Neural Architecture Search (NAS) アプローチによる、高精度かつ効率的なモデルです。
3 MIN READ
2024 年 6 月 28 日
NVIDIA NIM による財務分析の変革
金融サービスでは、ポートフォリオ マネージャーやリサーチ アナリストが膨大な量のデータを丹念に精査し、投資で競争力を高めています。
4 MIN READ
2024 年 4 月 2 日
NVIDIA TensorRT-LLM による、LoRA LLM のチューニングとデプロイ
LLM のトレーニング コストを抑え、そのパワーを活用可能なファインチューニングの手法の 1 つである、Low-Rank Adaptation (LoRA) の洞察力と実装について説明し、その応用と利点の一部をご紹介します。
7 MIN READ
2024 年 3 月 20 日
記録を塗り替え続ける NVIDIA cuOpt アルゴリズムがルート最適化ソリューションを 100 倍高速化
最適化アルゴリズムの主要な要素、その定義、業界をリードするソリューションに対して NVIDIA cuOpt のベンチマークを実行するプロセスについて掘り下げ、その比較の重要性に焦点を当ててご紹介します。
3 MIN READ
2024 年 3 月 18 日
NVIDIA GB200 NVL72 は兆単位パラメーターの LLM トレーニングとリアルタイム推論を実現
新しい NVIDIA GB200 NVL72 は、計算負荷が高く、リソースを大量に消費する大規模なモデルのトレーニングとデプロイに対応するシステムの 1 つです。
4 MIN READ
2024 年 3 月 18 日
NVIDIA NeMo Retriever で企業データを実用的なインサイトに変える
さまざまなデータ プラットフォーム企業が、NVIDIA と協力して NeMo Retriever を活用し、データを価値あるビジネス インサイトに変換している事例についてご紹介します。
2 MIN READ
2024 年 3 月 18 日
RAG アプリケーションを 4 つのステップでパイロットから本番環境に移行する方法
セキュリティ、サポート、安定性を提供する NVIDIA AI Enterprise は、企業による RAG アプリケーションのパイロットから本番環境への移行を支援します。
3 MIN READ
2024 年 2 月 22 日
NVIDIA Spectrum-X に対する AI ネットワーク パフォーマンスのベンチマークを Supermicro が提供
NVIDIA Spectrum-X はハイパースケール クラウド インフラの AI 向けに作られた最先端のネットワーキング プラットフォームとして脚光を浴びています。
2 MIN READ