サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Switch 2
weblab.t.u-tokyo.ac.jp
Home ニュース 東京大学松尾・岩澤研究室 GENIACプロジェクトにおいて、大規模言語モデル「Tanuki-8×8B」を開発・公開 AUG30 Lab News 発表のポイント 経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が「Tanuki-8×8B」を開発・公開。 本モデルは、フルスクラッチで開発されており、対話、作文能力を評価する指標「Japanese MT-Bench」において「GPT-3.5 Turbo」と同等以上の性能を達成。 Apache License 2.0のライセンスに基づき、研究および商業目的での自由な利用が可能。「Tanuki-8×8B」の軽量版である、「Tanuki-8B」をチャット形式で利用できるデモも公開。 本モデルのNejumi LLMリーダーボード3における評価 発表内容 東京大
最先端の大規模言語モデル(LLM)の基礎理論から応用事例まで網羅的にマスターしよう! 生成AIの基盤モデルとして注目を集める大規模言語モデル(LLM)について体系的に学べる実践型講座。LLMの基本からスタートし、LLMの学習や推論を支える技術、公開されているLLMやAPIなどの活用方法まで幅広く学べます。 実践型のデータサイエンティスト育成講座およびDeep Learning講座を10年以上運営し、のべ30,000人以上の人材を育成してきた東京大学松尾・岩澤研究室がコンテンツを監修・開発しています。 本講座はサマースクールの一環として大規模言語モデル(Large Language Models/LLM)に関して体系的に学べる講座を目的として開催されます。具体的には以下のスキルを身につける事を目的としています。 ・LLMの原理について,事前学習からRLHFまでの一連の流れや意味合いを理解する
Home ニュース 松尾教授が座長を務める、AI戦略会議の資料が公開されました。(第9回資料:「生成AIの産業における可能性」)
2024年3月2日(土)に、松尾研LLM開発プロジェクトのキックオフを実施しましたのでご報告いたします。 本プロジェクトは、当研究室が提供する講座の修了生および一般公募によって集まった有志の開発者のメンバーが500億パラメータサイズの大規模言語モデル開発を進めるものです。 また、開発された大規模言語モデル(LLM)の公開のみならず、開発過程の公開、そしてこれらの成果を社会全体で共有することを通じ、日本全体のLLM開発の技術レベル向上と社会実装の加速を目指します。 なお、本プロジェクトは国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)による、国内の生成AIの開発力を強化するためのプロジェクト「GENIAC(Generative AI Accelerator Challenge)」において、基盤モデル開発に必要な計算資源の提供支援を受けています。 ▼参考:NEDOの採択を受け、公
GENIAC 松尾研 LLM開発プロジェクト 本プロジェクトは、大規模言語モデル講座の修了生を含む、松尾・岩澤研究室講座の修了生および一般公募によって集まった有志の開発者(⺠間企業・研究者・学生で構成)約250名が7チームに分かれ、各チーム10BクラスのLLMをコンペティション形式で開発を行い、優勝チームが50BクラスのLLMを作り、これらのモデルやコード開発で得た知見を共有する事を目的に行われます。 国立研究開発法人新エネルギー・産業技術総合開発機構(以下「NEDO」)の「ポスト5G情報通信システム基盤強化研究開発事業/ポスト5G情報通信システムの開発(助成)」に係る公募に採択されており、経済産業省が主導する基盤モデルの開発に必要な計算資源に関する支援や関係者間の連携を促す「GENIAC」プロジェクトの一環として行われます。 GENIACの詳細はこちら:https://www.meti.
2023年度のLLM大規模言語モデル講座のコンテンツ公開は終了しました。 現在2024年度の受講生を募集しておりますので、LLM講座の受講をご検討下さい。 最終更新: 2024年8月7日 LLM 大規模言語モデル講座 2024 開講のお知らせ 昨年2,000名が受講した松尾研LLM講座を今年も開講します! [講座詳細]https://weblab.t.u-tokyo.ac.jp/education/large-language-model/ 松尾研究室からのお知らせ 2024年度 大規模言語モデル講座 詳細はこちらをご覧ください。 メンバー募集のお知らせ 松尾研究室では複数のLLMに関する開発プロジェクトを推進しており、一緒に働いてくれる仲間を募集しています!! LLM研究者(特任研究員・特任助教・特任講師) [1] 効率的なLLMの学習方法に関する研究 [2] LLMの動作原理の理解 [
訂正版20230822プレスリリース 東京大学松尾研究室 100億パラメータサイズ・日英2ヶ国語対応の 大規模言語モデル“Weblab-10B”を公開 ―公開済みの日本語大規模言語モデルで最高水準(注1)― この度日本語・英語の2ヶ国語に対応した100億パラメータサイズの大規模言語モデル(Large Language Model ;LLM)を事前学習と事後学習(ファインチューニング)により開発し、モデルを公開しましたのでお知らせします。今後も、Weblab-10Bのさらなる大規模化を進めるとともに、この資源を元に、LLMの産業実装に向けた研究を推進して参ります。 松尾研は、知能の謎を解くことを目的に人工知能の研究に取り組む研究室です。現在はテキスト生成で注目されることの多いLLMの技術ですが、今後は画像組み込みなどのマルチモーダル化、ブラウザ・ソフトウェア・ロボット等の行動制御の実装に発
人工知能を学ぶためのロードマップ このページでは、人工知能や深層学習を学んだことのない方を対象に、 それらを学ぶためのロードマップを紹介しています。 本ロードマップでは達成目標として、 「研究者」「データサイエンティスト」「エンジニア」「ビジネス」の 4つの職業ごとに4つのレベルを設けています。 まずはレベル0として、人工知能についての基礎的な知識を学びましょう。 技術に触れる(学習想定時間:1時間) まずは最新のAI技術に触れて,AIによってどのようなことができるのかを確認してみましょう. メジャーなサービスを含めいくつか紹介します. ・ChatGPT ChatGPT すでに利用したことがある方が多いかと思いますが、OpenAIが開発・運営する大規模言語モデル(LLM)チャットボットです。LLMでは他にGoogleのGemini、AnthropicのClaude、Mistral AIなど
松尾研では「知能を創る」というビジョンを掲げ、研究を進めています。 本記事では知能を創る上で重要な研究テーマとなる「世界モデル」について、松尾研の特任助教である鈴木雅大さんにお伺いしました。 (鈴木さんのインタビューは、前・後編の2回でお届けいたします。後編はこちら) 世界を「直感的」に理解する世界モデルは、真の知能の実現において必要不可欠。 ー「世界モデル」の説明をお聞きする前に、なぜ松尾研は「世界モデル」の研究を推進しているかを教えてください。 松尾研では「知能を創る」というビジョンを掲げており、世界モデルが真の知能の実現において必要不可欠だからです。 世界モデルについては後ほど詳しくご説明しますが、「外界(世界)から得られる観測情報に基づき外界の構造を学習によって獲得するモデル」を指します。 我々は、世界モデルが知能のベースにあって、その上に様々な知的な機能が実現できると考えています
2016年 未踏スーパークリエイター認定 2015年 M-1 グランプリ2015 二回戦進出(ロボットとして史上初) 2015年 The Boston Consulting Group入社 2014年 東京大学工学部システム創成学科 卒業
過去に得た知識を応用する、「転移学習」の研究が進んでいます。 今回は、この領域を中心に研究を重ね、先日8月1日付で松尾研に特任助教として入職した熊谷 亘さんのインタビューをお届けします。 「転移学習とは、人間なら成長過程や日々の生活の中で当たり前に行っていること」と熊谷さん。少しずつ議論が進んでいる汎用型AIの中でも、なぜ転移学習に注目しているのか、話を聞きました。 「問題を解く」とはどういうことか?学部では、数学を学んでいました。その中で、「問題を解くとはどういうことか」と考えるようになり、「人間より頭のいいものをつくればいいのでは」と思ったのが、人工知能に興味を持ったきっかけです。数学に限らずですが、人間より頭のいい人工知能をつくれれば、世の中の問題を全部解けるんじゃないか、と。 当時はそのための手法もよくわからなかったので、ひとまず基礎的な方向へ進もうと、修士でも数学を専攻しました。
Sorry, this entry is only available in Japanese. For the sake of viewer convenience, the content is shown below in the alternative language. You may click the link to switch the active language.
本プログラムの最大の特徴の一つは、全てのトピックについて、演習を中心に構成されている点です。実際に手を動かしながら理解を進めることで、効率よく学習することができます。 実際にモデルを学習させながら技術を習得する本格的な演習内容となっています。Deep Learningは、モデルが実際に学習する様子を観測し、パラメータを調整することでアプリケーションに応じたパフォーマンス最大化を行うことが非常に重要な技術ですが、この一連の流れを全ての演習で経験しながら重要な要素を身につけることが可能です。
松尾研究室の教育活動 TMIの授業である「ウェブ工学とビジネスモデル」、データサイエンティストの育成を行うグローバル消費インテリジェンス寄付講座(GCI)、DeepLearning の講座を運営するDeep Leaning JPを軸に、次世代の情報社会を担う人材を輩出すべく、実践的な教育活動を行っています。 TMIの授業である「ウェブ工学とビジネスモデル」においては、社会の基盤技術であるインターネットを用いたサービス開発を通じて情報化社会に於ける工学的素養を身につける授業を行っています。グローバル消費インテリジェンス寄付講座においては、データ分析をできるCMO人材を育成する講座を2014年から開始しており、のべ200名以上の学生が参加しております。DeepLearning.JPに於いては、ディープラーニング人材の教育講座を国内で最も早く開設。2015年11月から。学部や学年を超えた実践型の
東京大学で開催中のグローバル消費インテリジェンス寄附講座におけるデータ解析パートのコンテンツです。 全15Chapterを通し、データのセットアップから解析、可視化やモデルのアウトプットまでを一気通貫で学習できます。
Skip to content ABOUTMissions & Activities Members RESEARCHMajor Research Areas Web & Business Collaborative Research GENIAC project EDUCATIONOverview 講座一覧Deep Learning講座深層学習 深層強化学習 深層生成モデル 世界モデル 大規模言語モデル Web工学講座基礎プロジェクト Web工学とビジネスモデル データサイエンス (GCI) 機械学習講座動機付けプロジェクト 金融市場取引と機械学習 AI経営講座AI起業サマープログラム AI経営トランスフォーメーション 知能ロボット開発講座創造的ものづくりプロジェクト・創造性工学プロジェクト アントレプレナーシップ講座ディープテック起業実践演習 ディープテック起業家への招待 ビジョナリー
データのセットアップから解析、可視化やモデルのアウトプットまでを一気通貫で学習できます。全体を通じて、データ分析の「流れ」を掴むことを意識した講義設計となっております。
1997年3月:国際基督教大学教養学部社会科学科卒業。 1997年4月~1998年3月:株式会社教育開発研究所。「教職研修増刊号」「教職研修」の編集を担当。 1998年4月~1999年4月:フリーランス。学術論文の翻訳、英和辞典の校正、出版社サイトの構築・運営、学会開催の請負等を担当。この間に ACADEMIC RESOURCE GUIDEを創刊(1998-07-11)。 1998年12月~1999年5月:サイバースペース・ジャパン株式会社。専門ガイド型の検索エンジン「iNET Guide」の立ち上げに参画。 1999年5月~2009年7月:ヤフー株式会社に勤務。 2009年9月:アカデミック・リソース・ガイド株式会社を設立。
ウェルスナビウェルスナビ株式会社との共同研究で、人間が心理的な罠に陥らず、長期の資産運用を成功させられるよう、AIによってサポートすることを目的としています。
松尾研究室では 人工知能、ウェブ、ビジネスモデルの研究を軸に 本格研究から社会実装まで一気通貫で活動を行っています。
このページを最初にブックマークしてみませんか?
『Matsuo-Iwasawa Lab.』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く