並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 48件

新着順 人気順

brainpadの検索結果1 - 40 件 / 48件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

brainpadに関するエントリは48件あります。 AILLM学習 などが関連タグです。 人気エントリには 『GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad ブレインパッド』などがあります。
  • GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad ブレインパッド

    本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、GPT-4の登場から執筆日(2023年5月31日時点)までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきます。 LLM/ChatGPTの動向 オープンソースLLM モデル オープンソースLLMの調整 Adapter、LoRA Instruction Tuning Human Feedback プロンプトエンジニアリング プロンプトエンジニアリングの課題①:プロンプトに大量の情報を入れられない プロンプトエンジニアリングの課題②:複雑なタス

      GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad ブレインパッド
    • ChatGPT APIで「素人質問で恐縮ですが…」と鋭い質問してくるSlack Botを作った - Platinum Data Blog by BrainPad ブレインパッド

      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、議論を活性化する質問をLLM技術によって生成できないかと考え、『この分野は素人なのですが…Bot』を開発した内容を、ご紹介します。 こんにちは、アナリティクスサービス部の藤田です。 ブレインパッドでは、有志による社内勉強会がとても活発で、ほぼ毎日何かしらの勉強会が開かれています。社内勉強会では、参加者による質問が重要な役割を果たします。質問によって、質問者は理解を深めることができ、他の参加者や発表者にとっても新しい視点を得ることができます。しかし、参加者が多い

        ChatGPT APIで「素人質問で恐縮ですが…」と鋭い質問してくるSlack Botを作った - Platinum Data Blog by BrainPad ブレインパッド
      • Transformerによる時系列データ予測のご紹介 - Platinum Data Blog by BrainPad ブレインパッド

        本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 発展を続ける「自然言語処理」技術。その中でも幅広く使用される深層学習モデルTransformerは、自然言語処理以外の音楽生成や物体検出などの領域でも適用できます。本ブログでは、 Transformerを時系列データに適用する方法をご紹介します。 こんにちは、AIソリューションサービス部の井出と申します。 この記事では、特に自然言語処理分野で幅広く使用される深層学習モデルTransformerを時系列データへ適用する方法に関してご紹介します。 以前の記事では、Transformerの構造や特徴などについて、自然言語処理分野の機械翻訳を例としてご紹介しております。はじめに、こちらの記事をご一読していただくことで、より本記事でご紹介する内容に対する理解が深まるかと思います。 Transform

          Transformerによる時系列データ予測のご紹介 - Platinum Data Blog by BrainPad ブレインパッド
        • LLMを効率的に再学習する手法(PEFT)を解説 - Platinum Data Blog by BrainPad ブレインパッド

          本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、効率的にLLMのような事前学習済みモデルを再学習する手法(PEFT)についてご紹介します。 問題意識 ビジネスで利用する際に乗り越えるべき壁 PEFTとは何か? PEFTのコンセプト分類 トークン追加型 Prefix Tuning P Tuning Prompt Tuning Adapter型 Adapter LoRA型 LoRA Ada LoRA まとめ 参考文献 こんにちは、アナリティクスサービス部の辻です。 今回は、LLMを効率的に再学習する手法として今後

            LLMを効率的に再学習する手法(PEFT)を解説 - Platinum Data Blog by BrainPad ブレインパッド
          • プロンプトエンジニアリングの基本と応用 - Platinum Data Blog by BrainPad ブレインパッド

            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、プロンプトエンジニアリングをテーマに、1カ月ほど前に発表されたレビュー論文と関連論文を紹介します。 目次 今回のテーマ なぜプロンプトエンジニアリングが必要か? プロンプトエンジニアリング:基礎編 抑えておきたい考え方 明確に、正確に ハルシネーションスノーボール (Hallucination snowball) 1.1 ユーザーの要求を明確化するタイプ 1.2 LLMの知識を引き出すタイプ 2.1 直列型:推論ミスを減らすタイプ 2.2 並列型:出力の堅牢さを高めるタ

              プロンプトエンジニアリングの基本と応用 - Platinum Data Blog by BrainPad ブレインパッド
            • 自社プロダクトのデータ基盤における BigQuery SQLテストシステムについて - Platinum Data Blog by BrainPad

              「データ活用をより多くの人が、より効率的に実施できるようになる取り組み」をエンジニア観点から自発的に実施するカルチャーを持つ、自社開発プロダクト「Rtoaster(アールトースター)」のエンジニアチーム。今回は、データ基盤チームで作成した BigQuery でのテストシステムを紹介します! こんにちは、プロダクトビジネス本部開発部の柴内(データ基盤チーム)です。今回は、自社製品である「Rtoaster」プロダクトのデータ基盤チームで作成した BigQuery でのテストシステムについてご紹介します。 背景 データ基盤チームでは、 Rtoaster製品からリアルタイムに連携される、WebやアプリのトラッキングといったデータをGCSや BigQuery に蓄積するデータレイク データレイクにあるデータを BigQuery で加工・変換して利用しやすい形式にしたデータマートやデータウェアハウス

                自社プロダクトのデータ基盤における BigQuery SQLテストシステムについて - Platinum Data Blog by BrainPad
              • 自律型AIエージェントのご紹介 - Platinum Data Blog by BrainPad ブレインパッド

                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、自律型AIエージェントの機能や動作についての説明とあわせて、AIエージェントをいくつかご紹介します。 こんにちは。アナリティクスサービス部の江本です。 昨年2022年11月末にChatGPTがリリースされてから半年もたたずして、自律型AIエージェントが続々とリリースされ大きな話題を呼びました。 今では様々な自律型AIエージェントが存在しており、その多くはウェブブラウザを通して簡単に試すことができるようになっています。 本記事では、自律型AIエージェントの機能や

                  自律型AIエージェントのご紹介 - Platinum Data Blog by BrainPad ブレインパッド
                • ChatGPT APIで社内データについて回答するSlack BotとWebアプリを作った - Platinum Data Blog by BrainPad ブレインパッド

                  本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 5月16日から毎日更新を続けてきたLLM特集も、本ブログで第1弾が一区切りとなります。 最後を飾るブログでは、知りたいことを質問すると社内データから関連する内容を検索し、質問に対してよしなに回答をしてくれるSlack BotおよびWebアプリをChatGPT APIを使って作成したので、その内容をご紹介します。 こんにちは、アナリティクスサービス部の田中です。 社内には有益な情報が多くありますが、データ量が増えるにつれて調べたい情報に正確にアクセスすることが難しくなり

                    ChatGPT APIで社内データについて回答するSlack BotとWebアプリを作った - Platinum Data Blog by BrainPad ブレインパッド
                  • 自然言語処理界隈の巨人:Transformerモデルのご紹介 - Platinum Data Blog by BrainPad

                    本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 今回のブログでは、発展を続ける「自然言語処理」技術の中から、さまざまな自然言語処理の課題を非常に高い精度で解決する「Transformer」モデルをテーマに、なぜ分析精度が高いのかを解説します! はじめに こんにちは、アナリティクス本部アナリティクスサービス部の董です。 2017年に Google が発表した「attention is all you need」という論文で提案された「Transformer」は、機械翻訳や文章カテゴリの分類、文章生成等、さまざまな自然言語処理の課題を非常に高い精度で解決し、革命的な進歩で発展しています。当社でもTransformerモデルを業務に生かすことで、これまでは不可能だった分析が可能となっています。 本ブログでは、「なぜTransformerモデル

                      自然言語処理界隈の巨人:Transformerモデルのご紹介 - Platinum Data Blog by BrainPad
                    • ChatGPTとLangChainを活用してデータ分析アプリを作ってみた - Platinum Data Blog by BrainPad ブレインパッド

                      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、ChatGPTとLLMを使って、プログラミングの知識なしでデータ分析(前処理、可視化、学習、検証)を行えるツールアプリケーションを構築してみたので、その内容をご紹介します。 こんにちは、私たちはアナリティクスサービス部の田中、林です。今回はLangChainとChatGPTを使ったアプリケーションを作成してみたのでその内容について説明します。データ分析を進めたい、進めないといけない人たちが、プログラミングの知識なしでデータ分析(前処理、可視化、学習、検証

                        ChatGPTとLangChainを活用してデータ分析アプリを作ってみた - Platinum Data Blog by BrainPad ブレインパッド
                      • 【お詫び】弊社社員が投稿した「Qiita」記事について|株式会社ブレインパッド(BrainPad Inc.)

                        エンジニアに関する知識を記録・共有するためのサービス「Qiita」にて、当社が実施しております「BrainPad Advent Calendar 2021」に関して、ご報告申し上げます。 弊社社員が本年12月22日(水)に公開した記事(以下、本記事)において、同社員が別の投稿者が先行して「Qiita」に掲載していた記事を参考に本記事を執筆した結果、題材や探索手法等が先行記事と類似している箇所があることが判明いたしましたので、本記事を削除いたしました。(現在、本件に関する概要の記載とともに別の題材での代替記事の掲載を検討中です。) 【経緯】 本件の経緯といたしましては、以下の通りです。 本年12月23日(木)夜、本記事を執筆した同社員が、Qiitaの読者より「内容が過去の別の記事と類似している」点について通知を受けました。この際、同社員にて適切な対応および謝罪等がなされないまま、同社員の判断

                          【お詫び】弊社社員が投稿した「Qiita」記事について|株式会社ブレインパッド(BrainPad Inc.)
                        • 第1回:最近学んだ数理最適化の定式化のチップスたち 【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド

                          本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドの社員が「数理最適化技術」に関して連載するこの企画。 記念すべき初回は、当社のCDTO(Chief Data Technology Officer)が、数理最適化に関する書籍の輪読会を通じて得たTipsをご紹介します! こんにちは。CDTO (Chief Data Technology Officer) の太田です。 この記事は【連載】ブレインパッドの数理最適化ブログ(目次)の初回の記事です。 今回、「大阪大学数理最適化寄附講座」の開設に関わらせていただくことになったきっかけは、 TensorFlow User Group の有志の方々とともに主催している Optimization Night というコミュニティイベントでした。 現在、そのコミュニティのメンバー数名と週次の輪

                            第1回:最近学んだ数理最適化の定式化のチップスたち 【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド
                          • 自然言語処理分野で用いられる敵対的学習手法について - Platinum Data Blog by BrainPad ブレインパッド

                            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 当社データサイエンティストが、自然言語処理分野でよく用いられる「敵対的学習手法」から、「FGM(Fast Gradient Method)」「AWP(Adversarial Weight Perturbation)」手法をピックアップしてご紹介します。 こんにちは。アナリティクスサービス部の佐々木です。 今回は、自然言語処理の分野においてよく用いられる「敵対的学習手法」についてご紹介します。 敵対的学習とは 敵対的学習の手法 FGM(Fast Gradient Method) AWP(Adversarial Weight Perturbation) おわりに 参考文献 敵対的学習とは 深層学習モデルの発展により、自然言語処理分野を含め様々な分野で高い精度のモデルを作成できるようになってきた

                              自然言語処理分野で用いられる敵対的学習手法について - Platinum Data Blog by BrainPad ブレインパッド
                            • 第6回:OR-Toolsで巡回セールスマン問題を解く ~京都弾丸観光ツアーの作成を事例に~【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad

                              本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドの社員が「数理最適化技術」に関して連載するこの企画。 第6回は、当社のデータサイエンティストが、最適化ツールを使って、「1日でできるだけ多くの京都の観光地を巡る」という問題を解いています。 こんにちは、データサイエンティストの田中です。 最近は金融系のお客様のもとで常駐しながら分析を行ったり、新卒研修に携わったりしています。あと先月から、ちょっとお高いお米を買うようになってQOLが爆上がりしました。たったの数百円で毎日幸せを感じられるので、マジでおすすめです。 さて、今日はOR-Toolsという最適化ツールをご紹介し、いくつか実践的な制約を入れた巡回セールスマン問題を解いていきます。 はじめに 問題設定 データの取得・準備 OR-Toolsによる最適化 Step1. inde

                                第6回:OR-Toolsで巡回セールスマン問題を解く ~京都弾丸観光ツアーの作成を事例に~【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad
                              • 大規模言語モデル(LLM)のエンジン:データセットの解説 - Platinum Data Blog by BrainPad ブレインパッド

                                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、大規模言語モデルのデータセットのソース、収集方法、その信頼性と倫理性、そしてデータのクリーニングと前処理についての詳細を解説します。 近年に公開された大規模言語モデルの年表 *1 こんにちは、アナリティクスサービス部の金です。 今回の話題は、ビジネスや研究における大規模言語モデル(Large Language Models、略してLLM)の根幹を成すデータセットです。データセットの内容と構成は、大規模言語モデルの振る舞いに大きく影響を与えます。 この記事

                                  大規模言語モデル(LLM)のエンジン:データセットの解説 - Platinum Data Blog by BrainPad ブレインパッド
                                • 【連載①】大規模言語モデル(LLM)のビジネス利用に関して注意すべき点-LLMの使用許諾条件- - Platinum Data Blog by BrainPad ブレインパッド

                                  本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMのビジネス利用に関して注意すべき点、その中でも使用許諾条件についてまとめました。 はじめに 本連載で扱うLLMサービスのイメージと想定する対象者 連載内容(予定) LLMの使用許諾条件について ①プラットフォーマーが提供するサービスの利用条件(主にサービス提供者・ユーザーの方向け) サービスの商用利用の可否 利用条件(制限事項) ②ソースコードが公開されたモデルのライセンス(主にプラットフォーマーの方向け) モデル等の主な使用条件 ライセンス情報の確認方

                                    【連載①】大規模言語モデル(LLM)のビジネス利用に関して注意すべき点-LLMの使用許諾条件- - Platinum Data Blog by BrainPad ブレインパッド
                                  • RLHFを利用して用途に応じたLLMを生成できるツールの紹介 - Platinum Data Blog by BrainPad ブレインパッド

                                    本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、ChatGPTなどで好ましい応答を得られるように、人間からAIモデルの応答に働きかける、ヒューマンフィードバックというプロセスを支援する「Transformer Reinforcement Learning(TRL)」という強化学習ライブラリを紹介します。 こんにちは。アナリティクスサービス部の橋本です。 ChatGPTの学習プロセスとして取り入れられているRLHF(Reinforcement Learning from Human Feedback、人間のフ

                                      RLHFを利用して用途に応じたLLMを生成できるツールの紹介 - Platinum Data Blog by BrainPad ブレインパッド
                                    • 12年お世話になった BrainPad から Ubie へ行きます - 0-8

                                      11月30日をもって新卒入社から約12年勤めた BrainPad を辞め、新たに Ubie で働き始めることとしました!12年も勤めた会社を辞めるのはやっぱり個人的には大きな決断だったので、後で思い出せるよう、転職にあたって考えたことをつらつら書いておこうと思います。 Ubieの入社ブログは他の方々がたくさん書いていて、Ubieがどんな会社で、皆どんなところに惹かれたのかがわかるので面白いです。ただ、やっぱり僕は新卒から12年も働かせてもらった BrainPad にも思い入れがあって、 BrainPad のことも含めて書いておきたいので、なんとなく正式に転職する前の今1、この記事を書いています。疲れてやめたとかではなく、僕にとっては BrainPad も Ubie もどちらも良い会社で、とはいえ、いろいろ考えた末に Ubie を選んだ、というお話です。 医療版Googleを目指す Ubie

                                        12年お世話になった BrainPad から Ubie へ行きます - 0-8
                                      • Spark(DataProc)からBigQuery MLに移行してコストを削減した話 - Platinum Data Blog by BrainPad

                                        本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 自社開発サービスである「Rtoaster(アールトースター)」は、2019年にユーザー分析機能の「自動クラスタリング機能」をSpark(DataProc)からBigQueryMLに移行しました。 ブレインパッドの新卒2年目の自社サービス開発エンジニアが、新卒1年目で取り組んだ、この大きなプロジェクトでの経験についてご紹介します! はじめに 背景 ユーザー分析機能と自動クラスタリング 移行前の環境と問題点 BigQuery ML について 実装 モデル移行の実装 結果 料金の削減 実行時間の削減 運用の問題解消 最後に はじめに 本記事は、ブレインパッドの自社サービスである「Rtoaster(アールトースター)」のユーザー分析機能のチームで開発をしている、新卒入社2年目のエンジニア柴内がお送

                                          Spark(DataProc)からBigQuery MLに移行してコストを削減した話 - Platinum Data Blog by BrainPad
                                        • 多腕バンディット問題に触れてみる - Platinum Data Blog by BrainPad

                                          本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 当社自社開発プロダクト「Rtoaster」のAI機能「conomi-optimize」にも考え方を利用したアルゴリズムが使われている、多腕バンディッド問題。今回のブログでは、多腕バンディッド問題の内容と基本的な解法についてご紹介します! こんにちは、アナリティクスサービス部の小野川です。 今回は多腕バンディット問題と呼ばれる問題の内容とその基本的な解法についてご紹介したいと思います。 多腕バンディット問題概要 多腕バンディット問題とは強化学習に含まれるもので、複数の選択肢のなかからよりよい選択肢、つまりより報酬を得られやすい選択肢を選ぶという問題です。 ビジネス現場でもWeb広告最適化やレコメンドなどで活用しうるもので、活用範囲は幅広くあります。(実は弊社の製品であるRtoasterでもこ

                                            多腕バンディット問題に触れてみる - Platinum Data Blog by BrainPad
                                          • 第2回:ナップサック問題を色々な方法で解いてみた【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド

                                            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドの社員が「数理最適化技術」に関して連載するこの企画。 第2回は、当社のデータサイエンティストが、有名問題「ナップサック問題」の様々な解法を紹介しながら、実際に筆者が設定した問題例を解く過程を紹介しています。 こんにちは。アナリティクスサービス部の内池です。この記事では 【連載】ブレインパッドの数理最適化ブログ の第2弾として、最適化手法入門 データサイエンス入門シリーズ を読んで学んだことを活かし、現実の問題を様々な方法で解いていきたいと思います。 今回のテーマは組合せ最適化の有名問題であるナップサック問題です。ナップサック問題といえば「動的計画法」を思い浮かべる方が多いと思いますが、動的計画法だけでも様々なバリエーションがある他、動的計画法以外の効率的な解法も存在します。こ

                                              第2回:ナップサック問題を色々な方法で解いてみた【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド
                                            • ざっくりわかるRLHF(人間からのフィードバックを用いた強化学習) - Platinum Data Blog by BrainPad ブレインパッド

                                              本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 ChatGPTなど高性能な会話型AIの学習プロセスとして採用されているRLHFとは、一体何者なのかをご紹介します! こんにちは。アナリティクスサービス部の橋本です。 今回は、ChatGPTなど高性能な会話型AIの学習プロセスとして採用されているRLHF(Reinforcement Learning from Human Feedback、人間からのフィードバックを用いた強化学習)とは一体何者なのかをご紹介させていただきます。 ChatGPTなどの会話型AIが、どんな学

                                                ざっくりわかるRLHF(人間からのフィードバックを用いた強化学習) - Platinum Data Blog by BrainPad ブレインパッド
                                              • 【連載】ブレインパッドの数理最適化ブログ(目次) - Platinum Data Blog by BrainPad ブレインパッド

                                                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 数理最適化技術は、「データ活用の促進を通じて持続可能な未来をつくる」を企業ミッションとするブレインパッドにとって、必須の注力技術の1つです。 2020年10月1日、大阪大学に、ブレインパッドほかから寄付を受けた「大阪大学数理最適化寄附講座」が開設されました。同講座の教授を務められるのは、数理最適化技術の研究で大変著名な梅谷 俊治先生です。 これを機に、ブレインパッドも数理最適化技術に関するナレッジをさらに&どんどん高めていこうということで、この公式ブログでも数理最適化に関する連載をスタートします! こんにちは。CDTO(Chief Data Technology Officer) の太田です。 大阪大学にブレインパッドが寄付を実施し、「大阪大学数理最適化寄附講座」が開設されました。 それを

                                                  【連載】ブレインパッドの数理最適化ブログ(目次) - Platinum Data Blog by BrainPad ブレインパッド
                                                • 高次元データの可視化を目的とした次元削減手法を紹介 - Platinum Data Blog by BrainPad

                                                  本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 当社データサイエンティストが、高次元のデータをできる限り重要な情報を保持したまま低次元データに変換する「次元削減手法」について代表的な3つの手法をご紹介します。また、実際に画像データを用いて手法を試してみましたので、その結果もご紹介します! こんにちは。アナリティクスサービス部の西條です。 今回は、高次元データを可視化する際に使用する手法の1つである次元削減についてご紹介します。 次元削減とは 次元削減の手法 PCA t-SNE UMAP 各手法の比較 おわりに 参考文献 次元削減とは 次元削減とは、高次元のデータをできる限り重要な情報を保持したまま低次元データに変換する手法のことです。我々が取り扱うデータの中には画像や音声といった高次元データが存在しますが、これらを直接可視化して特徴把握

                                                    高次元データの可視化を目的とした次元削減手法を紹介 - Platinum Data Blog by BrainPad
                                                  • LLMを制御するには何をするべきか? - Platinum Data Blog by BrainPad ブレインパッド

                                                    本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMを制御するためのアプローチについてご紹介します。 問題意識 LLMが抱えるリスク LLMの振る舞いを制御するための技術 モデルを調整するアプローチ プロンプトエンジニアリング ファインチューニング アライメント モデルの前後を管理するアプローチ データクリーニング モデル監視 出力フィルタリング こんにちは、アナリティクスサービス部の辻です。 今回はLLM(Large Language Model、大規模言語モデル)の振る舞いを制御するためのアプローチに

                                                      LLMを制御するには何をするべきか? - Platinum Data Blog by BrainPad ブレインパッド
                                                    • RWKV(Receptance Weighted Key Value)をつかってみた - Platinum Data Blog by BrainPad ブレインパッド

                                                      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、Google Colaboratory を使って、チャットAI「ChatRWKV」の利用方法、ファインチューニング手法を紹介する他、ファインチューニング済みモデルとベースモデルの挙動の比較結果もご紹介します。 はじめに ChatRWKVの活用手順 RWKVのファインチューニング ファインチューニング済みのモデルの実行 終わりに 参考文献 はじめに こんにちは。ブレインパッドの丸山です。 最近、GPTなどのTransformerベースの生成系AIが注目を集

                                                        RWKV(Receptance Weighted Key Value)をつかってみた - Platinum Data Blog by BrainPad ブレインパッド
                                                      • 【Kaggle】American Express - Default Predictionコンペで金メダルを獲得しました - Platinum Data Blog by BrainPad

                                                        ブレインパッドのデータサイエンティストが、KaggleのAmerican Express - Default Predictionコンペに参加して、4874チーム中11位となり、上位入賞者に授与される金メダルを獲得しました! 本ブログでは今回のコンペの概要とアプローチをご紹介したいと思います。 こんにちは。アナリティクスサービス部の藤本です。 2022年5月~8月にかけてKaggle(データ分析コンペサイト)で開催されたAmerican Express - Default Predictionコンペに参加し、金メダルを獲得することができました! コンペの紹介と、今回どのような手法が有効だったかについて、本ブログでご紹介したいと思います。 図: kaggleサイト( https://www.kaggle.com/ https://www.kaggle.com/competitions/ame

                                                          【Kaggle】American Express - Default Predictionコンペで金メダルを獲得しました - Platinum Data Blog by BrainPad
                                                        • 社内勉強会で因果分析力を身につけよう! - Platinum Data Blog by BrainPad ブレインパッド

                                                          本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 技術やビジネスのナレッジ共有が文化として根付いているブレインパッドでは、日々、勉強会や講演会等が開催されています。今回は、社内で取り組んでいる因果分析勉強会をご紹介します! 記事の挨拶 こんにちは、アナリティクスコンサルティングユニットの羅(ろ)です。今回は社内で取り組んでいる因果分析勉強会についてご紹介いたします。因果分析はマーケティング施策の効果検証や新薬の治験など、効果の有無を知るための統計的手法として広く用いられています。 はじめに 開催目的と動機 ◦実務上で因果分析を効果的に活用するためには、必要なツールやコードを整備することが重要です。データ分析のための前処理や機械学習モデルの実装、因果関係の可視化ツールなど、適切なリソースを整えることで、案件において因果分析を使用するハードル

                                                            社内勉強会で因果分析力を身につけよう! - Platinum Data Blog by BrainPad ブレインパッド
                                                          • 大規模自然言語モデル(LLM)をお試し利用できるツールを作ってみた - Platinum Data Blog by BrainPad ブレインパッド

                                                            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、さまざまなLLMにどういった特徴や違いがあるのかを検証するための、GUIで複数のLLMをお試し利用できるツールを作成したのでご紹介します。 こんにちは、アナリティクスサービス部の髙橋です。 ChatGPTが登場して以降、さまざまな大規模言語モデル(LLM)が発表されていますね。 使う側としては楽しみな反面、業務で使うとなるとそれぞれのモデルにどういった特徴、違いがあるのかを検証していく必要があるのかな、と感じています。 そこで今回は、いくつかの大規模言語モデル

                                                              大規模自然言語モデル(LLM)をお試し利用できるツールを作ってみた - Platinum Data Blog by BrainPad ブレインパッド
                                                            • OpenCALM-7Bにファインチューニングを実施してポジネガ分析に関して賢くなるかを確認してみた - Platinum Data Blog by BrainPad ブレインパッド

                                                              本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回、日本語LLMである「OpenCALM-7B」と日本語データセット「JGLUE」のポジネガ分析のデータセット(MARC-ja)を利用し、「ポジネガ分析」に特化したファインチューニングを実施したので、ご紹介します。 はじめに こんにちは。アナリティスクスサービス部の中山です。 この記事では、「株式会社サイバーエージェント」*1が開発した商用利用可能なライセンスの日本語LLMである「OpenCALM-7B」に対して、「ヤフー株式会社」が公開している日本語データセット「

                                                                OpenCALM-7Bにファインチューニングを実施してポジネガ分析に関して賢くなるかを確認してみた - Platinum Data Blog by BrainPad ブレインパッド
                                                              • Auto-GPTを使って2値分類タスクを解いてみた - Platinum Data Blog by BrainPad ブレインパッド

                                                                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、自律型AIエージェントに実際人間が解くような比較的複雑なタスクを与えた場合にどのような挙動を示すのかを確認するため、「Auto-GPT」に2値分類タスクを与えてみたのでその挙動をご紹介します。 はじめに はじめまして。アナリティクスサービス部の後藤、AIソリューションサービス部の林です。 ChatGPTが2022年11月30日に公開されて以降、ChatGPTを利用したサービスが多く開発・公開され非常に盛り上がりのある領域となっています。 その中でChatGPT

                                                                  Auto-GPTを使って2値分類タスクを解いてみた - Platinum Data Blog by BrainPad ブレインパッド
                                                                • ブレインパッド社員が投稿したQiita記事まとめ(2020年1月~5月、Python、Google Cloud Platform、音声認識ほか) - Platinum Data Blog by BrainPad

                                                                  2018年1月より、ブレインパッドが始めているQiita Organization。社員が投稿した「Qiita記事まとめ」として、2020年1月~5月の記事をご紹介していきます! こんにちは。広報の中村です。 ブレインパッドのデータサイエンティスト・エンジニアが投稿する技術トピックをQiita Organizationにまとめています。 qiita.com このブログを執筆している日時点で167記事が投稿されています! 今回は2020年1月~5月に投稿された記事をご紹介します! 日付 タイトル(リンク) カテゴリ 2020.01.02 Google提供のDataflowテンプレートとJavaScriptの話 JavaScript、Google Cloud Platform、gcp、dataflow、ApacheBeam 2020.01.01 Google Cloud Speech API

                                                                    ブレインパッド社員が投稿したQiita記事まとめ(2020年1月~5月、Python、Google Cloud Platform、音声認識ほか) - Platinum Data Blog by BrainPad
                                                                  • LLM カテゴリーの記事一覧 - Platinum Data Blog by BrainPad

                                                                    このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 5月16日から毎日更新を続けてきたLLM特集も、本ブログで第1弾が一区切…

                                                                      LLM カテゴリーの記事一覧 - Platinum Data Blog by BrainPad
                                                                    • 第3回:はじめての配送計画の列生成法【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド

                                                                      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドの社員が「数理最適化技術」に関して連載するこの企画。 第3回は、当社のデータサイエンティストが、与えられた条件を満たしつつトラックの移動距離が最小になるような配送計画の問題を題材に、列生成法をご紹介します。 こんにちは。アナリティクスサービス部の岡﨑です。 この記事では 【連載】ブレインパッドの数理最適化ブログ(目次) - Platinum Data Blog by BrainPadの第3弾として、配送計画問題を題材にして列生成法をご紹介いたします。数理最適化に若干の心得があるが列生成法を知らない読者*1が「自分でも列生成を試してみたい!」と感じていただくことを目標に、本記事を執筆しています。 はじめに 容量制約付き配送計画問題 問題設定 方針 定式化 全ルート列挙 列生成法

                                                                        第3回:はじめての配送計画の列生成法【ブレインパッドの数理最適化ブログ】 - Platinum Data Blog by BrainPad ブレインパッド
                                                                      • 【連載①】生成AIのマルチモーダルモデルでできること -タスク紹介編- - Platinum Data Blog by BrainPad ブレインパッド

                                                                        本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、生成AIの中でも、テキスト、画像、動画、3Dデータ、オーディオデータ、モーションなど多岐にわたるマルチモーダル系のタスクについて、全2回の連載でご紹介します。 こんにちは、アナリティクスサービス部の八登です。 昨今話題をさらっている生成AIですが、ChatGPTのようなテキストベースのタスクだけでなく、マルチモーダル系のタスクにも大きな関心が集まっています。 ここでマルチモーダルとは、AIが同時に複数の形式を扱うことができる、ということを指します。 モー

                                                                          【連載①】生成AIのマルチモーダルモデルでできること -タスク紹介編- - Platinum Data Blog by BrainPad ブレインパッド
                                                                        • 画像分類手法を用いた時系列分類手法とKaggle Code輪読会のご紹介 - Platinum Data Blog by BrainPad

                                                                          本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドでは進化の激しいデータ分析業界で最新情報をキャッチアップしていくため、様々な勉強会が社内で開催されています。その中のKaggle Code輪読会について、その目的や活動内容、実際に発表された内容をご紹介します。 こんにちは。アナリティクスサービス部の諸橋と申します。 この記事ではブレインパッド社内で行われている勉強会の一つである「Kaggle Code輪読会」についてご紹介します。 また、輪読会で紹介されたKaggle Code(※データ分析プラットフォームKaggleに投稿された分析コードのこと)とその議論の内容についても紹介します。 今回紹介するKaggle Codeはセンサーデータとして取得された時系列データをグラフ化し、そのグラフに対して画像分類を行うことで元々の時系

                                                                            画像分類手法を用いた時系列分類手法とKaggle Code輪読会のご紹介 - Platinum Data Blog by BrainPad
                                                                          • LLMの推論を効率化する量子化技術調査 【技術動向調査】 - Platinum Data Blog by BrainPad ブレインパッド

                                                                            本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 ブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 本記事から週に1回程度の頻度で、社内で実施している生成AI・LLMに関する論文レビュー会の内容をピックアップのうえ配信していきますので、ぜひご期待ください。 今回は、LLMの学習や推論の効率化・高速化に関する4つの技術論文をご紹介させていただきます。 目次 LLM論文レビュー会とは 今回のテーマ A Survey of Quantization Methods for Efficient Neural Network Inference 選定理由 論文概要 量子化の基本的な手

                                                                              LLMの推論を効率化する量子化技術調査 【技術動向調査】 - Platinum Data Blog by BrainPad ブレインパッド
                                                                            • LLM推論にGPUは1つでいい?FlexGenについてまとめてみた - Platinum Data Blog by BrainPad ブレインパッド

                                                                              本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、LLMをお手元のPCで扱ってみたい方々に知っていただきたい、2023年2月にリリースされたLLMの処理を行うための生成エンジン「FlexGen」を解説します。 FlexGenとは FlexGenのメカニズム 1. GPU、CPUメモリ、そしてディスクを利用した分散処理 (オフローディング) 2. LLMの重み、キー、バリューを4ビット整数に圧縮する処理 (量子化) 3. 従来の処理手法と異なるジグザグ処理 FlexGenと他生成エンジンのベンチマーク比較 まと

                                                                                LLM推論にGPUは1つでいい?FlexGenについてまとめてみた - Platinum Data Blog by BrainPad ブレインパッド
                                                                              • プロンプトエンジニアリング手法 外部データ接続・RAG編 - Platinum Data Blog by BrainPad ブレインパッド

                                                                                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、Retrieval Augmented Generationを使用して、ユーザーからの質問に対して外部データを基に回答を生成させてみたので、その方法をご紹介します。 こんにちは、アナリティクスサービス部の秋本です。 LLMを用いてサービスやアプリを作成する場合、プロンプトに収まらない程の長い文章や独自のデータを教えたくなる事があるかと思います。また、それらは一定の頻度で整備・更新されます。その都度トレーニング済みモデルを調整するのは手間がかかります。 本

                                                                                  プロンプトエンジニアリング手法 外部データ接続・RAG編 - Platinum Data Blog by BrainPad ブレインパッド
                                                                                • Google が提供するLLMサービスとPaLM2のFine-Tuningについて - Platinum Data Blog by BrainPad ブレインパッド

                                                                                  本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 今回は、Google から提供されているLLMやGenerative AIサービスのうち、直近にリリースされた各サービスの紹介と、それらの基盤となっている新しいモデルの一つ「PaLM2」をFine-Tuningする方法を紹介します。 こんにちは。アナリティクスサービス部の安田です。昨今、LLMやGenerative AIが大きな注目を集めていますが、Google からもそれらを利用するためのさまざまな機能・サービスが提供されています。今回は直近リリースされた各サービス

                                                                                    Google が提供するLLMサービスとPaLM2のFine-Tuningについて - Platinum Data Blog by BrainPad ブレインパッド

                                                                                  新着記事