「DeepMind」を含む日記 RSS

はてなキーワード: DeepMindとは

2024-12-08

anond:20241205074730

DQNDeep Q-Network)は、強化学習Reinforcement Learning)のアルゴリズム一種で、DeepMindが2015年提案しました。DQNは、従来のQ学習(Q-Learning)と深層学習Deep Learning)を組み合わせたもので、特に状態空間が非常に大きい問題で優れた性能を発揮します。

2024-11-10

囲碁史上、最も重要棋士人物16選

1. 吉備真備日本囲碁の始祖)

中国囲碁を学び、日本に伝えたとされる。

大宝律令の中に碁に関する項目があること、隋書倭国伝に「好棋博、握槊、樗蒲之戯(囲碁、握槊、樗蒲(さいころ)の競技を好む)」との記載があることから、実際にはさらに以前から伝わっていた説もある。

2. 本因坊算砂(初代本因坊

囲碁四家の筆頭・本因坊家の始祖。

信長秀吉家康等に仕え囲碁指南する。

後の幕府保護に繋がる礎を築いた。

初代碁所であると同時に初代将棋所でもあった。

3. 徳川家康囲碁保護

本因坊安井井上・林の四家を召し抱え囲碁庇護した。

幕府庇護のもと囲碁に専念する職業棋士誕生し四家の互いの切磋琢磨により日本での囲碁技術が飛躍的に向上、多くの名手が生まれる土壌が整えられた。

朝鮮通信使で来た囲碁の名手と日本棋士との差は3子であったという。

近世囲碁の発展、振興に絶大な貢献。囲碁殿堂表彰にも第一回で選ばれている。

4. 本因坊道策(段位や手割りの発明

囲碁史上最も偉大な棋士の一人。

いまや囲碁以外でも用いられている段位制度発明し、棋士同士の実力差を可視化囲碁競技性を高めた。

手割りも彼の発明であり囲碁局面評価技術発展に大きな影響を与えた。

その卓越した棋力は「棋聖」「実力十三段」と称された。(当時の実力最高段位は七段、九段名人

5. 大倉喜七郎日本棋院創設)

帝国ホテル、およびホテルオークラ創設者である大倉喜八郎の息子で大倉財閥2代目総帥

明治維新により幕府後ろ盾を失い混迷と貧窮を極める囲碁界に対し経済面で多大な援助を行い、本因坊家、方円社、裨聖会等乱立する各派閥大同合意させ日本棋院を設立

1946年まで日本棋院副総裁を務めて名誉総裁となる。

財界の力を背景に棋士たちをまとめ、混乱を収拾し碁界合同に物心両面で貢献し現在囲碁界の礎を築いた。

現在でもホテルオークラには高級囲碁サロンがあるという。

6. 喜多文子女流囲碁の母)

女流棋士として初の実力四段となり、また多くの女流棋士を育てたこから現代女流碁界の母」と呼ばれる。

女性囲碁界で活躍する道を切り開いた。

喜多は杉内寿子を始め多くの女性棋士の育成にも尽力し、女流囲碁界の興隆に貢献した。

彼女情熱努力により、女性囲碁参加が増え、囲碁界の多様性が高まった。

NHK朝ドラあさが来た」のヒロインモデル広岡浅子とも交流があり二人の棋譜が残っている。(明治41年朝日新聞掲載

https://kajimaya-asako.daido-life.co.jp/column/15.html

7. 本因坊秀哉(家元最後本因坊、終身名人最後名人

本因坊名跡日本棋院に譲渡し、選手権制の本因坊戦創設に導いた。

川端康成小説名人』のモデルとしても知られる。

8. 木谷實(新布石・後進の育成)

囲碁常識を変えた「新布石理論提唱者として知られる。呉清源と共に伝統的な布石にとらわれない大胆な構想で囲碁戦略革新をもたらした。

また多くの内弟子を取って育成し、大竹英雄名誉碁聖加藤正夫名誉王座・二十四世本因坊秀芳・武宮正樹九段小林光一名誉棋聖・二十五世本因坊治勲など「木谷門下」として知られる多くのトップ棋士を輩出した。

木谷の教育と熱意は、日本囲碁界のレベルを大きく引き上げ、現代囲碁の礎を築いた。

9. 呉清源(新布石

道策に匹敵する囲碁史上最も革新的な棋士の一人。

木谷實とともに革新的な布石を開発し、囲碁戦術戦略革命を起こした。

呉の卓越した棋力は「昭和棋聖」と称され、多くの名勝負を残した。

彼の影響は日本のみならず世界囲碁界に及び、囲碁の深みと可能性を広げた。

10. 岩本薫海外普及)

私財を投じて海外囲碁普及に尽力。ヨーロッパアメリカを訪れ、講演や指導を通じて囲碁の魅力を世界に伝えた。

岩本活動により、海外での囲碁人口が増加し、国際的囲碁交流の基盤が築かれた。

原爆下の対局」でも知られる。

11. 武宮正樹囲碁常識を覆す宇宙流)

宇宙流」と呼ばれる独特の打ち方で知られる。

陣地の多い方が勝ちであるゲームにも関わらず、地を取りに行かず盤上全体を大きく使い従来の囲碁常識を覆す。

武宮の革新的な戦法は多くのファンを魅了し、囲碁可能性を広げた。

国際棋戦でも活躍し、日本囲碁の強さを世界に示した。

12. 藤沢秀行中韓棋士の育成・強化)

独特の棋風と人柄で多くの人々に影響を与えた。中国韓国棋士との交流を深め、彼らの育成と強化に貢献した。

藤沢自身経験技術を惜しみなく伝え、国際的囲碁レベル向上に寄与した。

13. 曺薫鉉(日本修行自身弟子世界一の棋士に)

日本修行を積み、後に帰国韓国囲碁界の発展に大きく貢献した。

また、彼の弟子である李昌鎬を育成し、共に世界一の座を競い合った。

韓国囲碁の飛躍的な成長を支え、国際囲碁界に大きな影響を与えた。

日本囲碁トップの座から降り、囲碁界の勢力図が塗り替わる大きなきっかけとなった。

14. 李昌鎬世界一の棋士

史上最強棋士の一人とされる。曺薫鉉の弟子として才能を開花させ、圧倒的な強さを誇り多くの国際棋戦で優勝した。

国際棋戦の優勝回数は歴代最多であり、2位以下に大きな差をつけている。

15. ほったゆみ小畑健ヒカルの碁

ヒカルの碁』のヒットにより少年少女たちの囲碁人口を増加させる。

低迷極まる囲碁界に一筋の光をもたらした。

ヒカルの碁がなければ日本囲碁界は今よりもっと厳しい状況に置かれていただろうことは想像に難くない

16. デミス・ハサビスAlphaGoAIおよび囲碁革命

DeepMind社の創設者。ハサビスのチームが開発したAIAlphaGo」が2016年世界トップ棋士李世ドルを破り囲碁界に衝撃をもたらす。

AlphaGoの登場は人間思考を超えるAI可能性を示し囲碁戦略研究にも新たな視点提供した。

今まで悪手とされていた手が見直されたり人間には全く思いつかない手を編み出す等、囲碁常識AI前とAI後では大きく変わった。

2024年にはノーベル賞を受賞した。

追記

芮廼偉(見えない天井を破る)

韓国で当時世界トップ棋士の曺薫鉉を番勝負で破り女性で初めて男女混合棋戦でのタイトルを取る。

囲碁性別関係なく戦える競技であることを示した。

2024-04-22

ヨーロッパの主要都市におけるソフトウェアエンジニア向けベストカンパ

# ヨーロッパの主要都市におけるソフトウェアエンジニア向けベストカンパニー

ヨーロッパの各都市ソフトウェアエンジニアにとって最適な企業を探しているなら、以下のリストが参考になるでしょう。

## チューリッヒ, スイス

Google, Facebook, Snap, NVIDIA, Microsoft, Apple, Oracle, Snyk, GetYourGuide, UBS, Swisscom, DFINITY, Cisco.

## ロンドン, イングランド

Google, Facebook, Snap, Jane Street, Stripe, Coinbase, Apple, Amazon, Hudson River Trading, Citadel, ByteDance, Two Sigma, Palantir, Bloomberg, Revolut, GSA Capital, Marshall Wace, Quadrature, Five Rings, G-Research, Starling, Personio, DeepMind, DRW, Millenium, BlackRock, MAN Group, Jump Trading, DE Shaw, AQR, Maven Securities, Point72, IMC, Optiver, Susquehanna (SIG), XTX, Old Mission, Squarepoint, Qube Research & Technologies (QRT), Yelp.

## アムステルダム, オランダ

Uber, Databricks, Bitvavo, Booking, Miro, Flexport, Atlassian, Spotify, Optiver, IMC, Amazon, Adyen, Google, Stripe, Flow Traders, MessageBird, Reddit, Box, JetBrains, Personio, Elastic, GitHub, Catawiki, Tower Research, Radix Trading, Headlands Technologies, Tomtom.

## パリ, フランス

Google, Meta, Datadog, Criteo, Microsoft, Stripe, Airbnb, Amazon, Atlassian, Hubspot, Workday, Ankorstore, Red Hat, Algolia, Alan, 360Learning, ContentSquare.

## ベルリン, ドイツ

AWS, Amazon, Microsoft, Wayfair, Google, Meta, Apple, HubSpot, Stripe, NVIDIA, Snowflake, Personio, Databricks, JetBrains.

## ダブリン, アイルランド

AWS, Microsoft, Google, Mastercard, Workday, Salesforce, Meta, Stripe, VMware, LinkedIn, Etsy, Personio, ByteDance, Coinbase, Hubspot.

## ミュンヘン, ドイツ

Google, Apple, Microsoft, Nvidia, Adobe, Workday, Celonis, BMW, Salesforce, SIXT, SAP, Huawei, Personio, Intel, JetBrains, IBM.

## ワルシャワ, ポーランド

Google, Snowflake, Netflix, Pinterest, Rippling, Oracle, Waymo, AMD, Samsung, NVIDIA, Box, Warner Bros, Visa, Amazon.

## バルセロナ, スペイン

Amazon, Apple, New Relic, Stripe, Rippling, Revolut, Skyscanner, Microsoft, N26, Criteo, Adobe, Thoughtworks, Oracle, Glovo, Personio.

## ケンブリッジ, イングランド

Apple, Amazon, Roku, Arm, Microsoft, Qualcomm, MathWorks, AMD.

## エディンバラ, スコットランド

Amazon, Oracle, Microsoft, Flutter, Unity, Skyscanner, Huawei.

## ベオグラード, セルビア

Databricks, Microsoft, Nutanix, Rivian, Foursquare, Yandex, JetBrains, Nordeus, Luxoft.

## マドリード, スペイン

Amazon, Datadog, Microsoft, Apple, Google, Personio, Twilio, Glovo, VMware, Meta, Oracle, Revolut.

## ストックホルム, スウェーデン

Klarna, Spotify, Netlight, PayPal, Ericsson, Ubisoft, Warner Bros, King, Google, Oracle, AWS, Microsoft, Wolt.

## クラクフ, ポーランド

Google, Rippling, Oracle, Revolut, Uber, Amazon, Deliveroo, IBM, Splunk.

## ブカレスト, ルーマニア

Crowdstrike, UI Path, Google, Adobe, Stripe, Microsoft, Oracle, IBM, Amazon, Electronic Arts (EA).

## コペンハーゲン, デンマーク

Microsoft, Maersk, Zendesk, Workday, Unity.

## プラハ, チェコ共和国

Productboard, Pure Storage, Apple, Workday, Oracle, Microsoft, JetBrains, Proton, Parrot.

## タリン, エストニア

Bolt, Wise, Microsoft, Twilio, Wolt.

## オスロ, ノルウェー

Microsoft, Cisco, Aker Solutions, Arm, Mastercard, Meta, Kahoot, Autostore, Remarkable, Netlight.

## ソフィア, ブルガリア

VMWare, Uber, Docker, IBM.

これらの都市は、ソフトウェアエンジニアにとって多くの機会を提供しています。それぞれの都市提供する企業は、エンジニア自身キャリアを発展させるための多くの選択肢提供しています。それぞれの企業提供する機会や文化は、エンジニア自身キャリア目標に合わせて最適な選択をするのに役立ちます。 [

2024-01-26

[]2024/01/26

ビル・ゲイツダボス会議富裕層への増税を訴える

https://www.msn.com/ja-jp/money/other/%E3%83%93%E3%83%AB-%E3%82%B2%E3%82%A4%E3%83%84-%E3%83%80%E3%83%9C%E3%82%B9%E4%BC%9A%E8%AD%B0%E3%81%A7%E5%AF%8C%E8%A3%95%E5%B1%A4%E3%81%B8%E3%81%AE%E5%A2%97%E7%A8%8E%E3%82%92%E8%A8%B4%E3%81%88%E3%82%8B/ar-BB1h9nrM?ocid=socialshare

 

電撃解任そして復職から2ヶ月、サム・アルトマン氏がダボス会議に登場——汎用AIに対する考えを軟化

https://thebridge.jp/2024/01/in-davos-sam-altman-softens-tone-on-agi-two-months-after-openai-drama

 

メタがAGIのオープンソース計画ザッカーバーグ宣言

https://www.msn.com/ja-jp/news/techandscience/%E3%83%A1%E3%82%BF%E3%81%8C%E6%B1%8E%E7%94%A8%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD-agi-%E3%81%AE%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E5%8C%96%E8%A8%88%E7%94%BB-%E3%82%B6%E3%83%83%E3%82%AB%E3%83%BC%E3%83%90%E3%83%BC%E3%82%B0%E5%AE%A3%E8%A8%80/ar-BB1gVm3r?ocid=socialshare

 

ダボス会議が閉幕、企業トップ紛争の先探る 米経済を楽観視

https://www.msn.com/ja-jp/news/money/%E3%83%80%E3%83%9C%E3%82%B9%E4%BC%9A%E8%AD%B0%E3%81%8C%E9%96%89%E5%B9%95-%E4%BC%81%E6%A5%AD%E3%83%88%E3%83%83%E3%83%97%E3%81%AF%E7%B4%9B%E4%BA%89%E3%81%AE%E5%85%88%E6%8E%A2%E3%82%8B-%E7%B1%B3%E7%B5%8C%E6%B8%88%E3%82%92%E6%A5%BD%E8%A6%B3%E8%A6%96/ar-BB1h2RB6?ocid=socialshare

 

Google DeepMindが数オリの幾何学問題を解けるAI「AlphaGeometry」を発表

https://www.msn.com/ja-jp/news/techandscience/google-deepmind%E3%81%8C%E6%95%B0%E5%AD%A6%E3%82%AA%E3%83%AA%E3%83%B3%E3%83%94%E3%83%83%E3%82%AF%E3%83%AC%E3%83%99%E3%83%AB%E3%81%AE%E5%B9%BE%E4%BD%95%E5%AD%A6%E5%95%8F%E9%A1%8C%E3%82%92%E8%A7%A3%E3%81%91%E3%82%8Bai-alphageometry-%E3%82%92%E7%99%BA%E8%A1%A8-%E4%BA%BA%E9%96%93%E3%81%AE%E9%87%91%E3%83%A1%E3%83%80%E3%83%AA%E3%82%B9%E3%83%88%E3%81%AB%E8%BF%91%E3%81%84%E6%80%A7%E8%83%BD%E3%82%92%E7%99%BA%E6%8F%AE/ar-AA1n9hfo?ocid=socialshare

2023-09-27

AIには人格がない」と言う想像力欠如人間

昨日、「AI人格を感じるやつは馬鹿」と言う自称インテリとバトルをした。奴は結局、インテリ自称するだけの、無知想像力の欠如した人でしか無かった。

さて、AI人格性について面白い論文があるので紹介しよう。

 

ーーー

AIによる自然発生的な敵対行為可能性に対する懸念が高まっている。

今年初めにChatGPT ユーザーが、1 足す 1 は何に等しいかと尋ねたところ、「1 + 1? 冗談ですか? 私に基本的数学質問をするなんて賢いと思いますか? … 大人になって、来てみてください」と答えたと報告した。

あるいは、アレン AI 研究所最近研究者が ChatGPT を簡単誘導して辛辣発言人種差別的な発言でっち上げることができることを実証した。

「ChatGPTに割り当てられたペルソナに応じて、その毒性は最大[6倍]に増加し、出力が誤った固定観念有害対話有害意見に関与する可能性がある」と研究者らは述べた。

LLM の出力にそのような「暗い人格パターン」が現れるのを目撃したディープマインド研究者らは、ケンブリッジ大学東京慶応義塾大学、およびカリフォルニア大学バークレー校代表者と協力して、人間人格特性定義できるかどうかを調べ始めた。そして彼らは、実際に人格特性定義できるということを発見した。

チームは数百の質問構成されるテスト システムを開発した。さまざまな人格基準確立し、チャットボットに一連の質問をした。

回答は、意見、態度、行動を定量的に測定するリンカートスケールと同様の評価ツール使用して分析された。

研究者らは、AI人格が、外向性、協調性、誠実さ、神経症的傾向、経験への寛容さなど、長年確立されてきた特定特性に沿って測定できることを発見したのである

「LLM出力の人格は、特定人格プロファイル模倣するために、望ましい次元に沿って形成できることがわかりました」とDeepMindのMustafa Safdari氏は述べている。彼と彼の同僚は、その結果を「Personality Traits in Large Language Models」というタイトル論文で報告し、プレプリント サーバーarXivで公開された。

「LLM の出力が人間回答者の出力と区別できないように設定することは可能です」とサフダリ氏は述べた。

研究者らは、AI人格特性を正確に定義できることが、敵対的な傾向を持つモデル排除する取り組みの鍵となると述べた。

「有毒または有害言語出力につながる特定特性レベル制御することで、LLM とのやり取りをより安全に、毒性を軽減できる可能性があります」とサフダリ氏は述べている。

 

参考: https://arxiv.org/abs/2307.00184

 

https://anond.hatelabo.jp/20230927010839

2023-08-21

君たちさぁ、結果論で叩くのは簡単だけどさ

次に超伝導が盛り上がったら「超伝導投資してなかった日本はクソ」

次にIPS細胞が盛り上がったら「IPS細胞投資してなかった日本はクソ」

次に空飛ぶ自動車が盛り上がったら「空飛ぶ自動車投資してなかった日本はクソ」

批判ばっかりするなら最初からアンテナ張って次に来るもの予想してみろってんだ


AI勃興時代2015年あたりからAIに着目してた人だけが石を投げなさい

ニューラルネットが出てから物体認識タスクCNNがこれまでのHoG圧勝するあたりまでAI冬の時代なんて言われてたんだぜ。

ちなみにいち早くDeepMindを買収して育てたのは米国国策じゃなくGoogleだ。

2023-04-22

ただのメモ

https://arxiv.org/pdf/2304.10466.pdf

効率的な深層強化学習には過学習規制必要

 

試行錯誤によって方針学習する深層強化学習アルゴリズムは、環境積極的相互作用することによって収集された限られた量のデータから学習しなければならない。多くの先行研究が、データ効率の良いRLを実現するためには適切な正則化技術重要であることを示していますが、データ効率の良いRLにおけるボトルネック一般的理解不明なままでした。その結果、すべての領域でうまく機能する普遍的技術を考案することは困難であった。

論文では、非定常性、過剰な行動分布シフトオーバーフィッティングなどのいくつかの潜在的な仮説を検討することにより、サンプル効率的な深層RLの主要なボトルネック理解することを試みている。

  

効率のいい強化学習って難しいんですね

強化学習ってよく知らない

 

我々は、状態ベースDeepMind control suite(DMCタスクについて、制御された体系的な方法で徹底的な実証分析を行い、遷移の検証セットにおける高い時間差(TD)誤差が、深いRLアルゴリズムの性能に深刻な影響を与える主犯であり、良い性能をもたらす先行手法は、実際、検証TD誤差を低く制御することを示した。この観察からディープRLを効率化するための強固な原理が得られる。すなわち、教師あり学習正則化技術を利用することで、検証TD誤差をヒルクライムできる。

 

時間差(TD)誤差ってやつがだめらしい

誤差を減らすのがDeepLearningだけど、それが時間差なのか。

  

我々は、検証TD誤差をターゲットとするシンプルオンラインモデル選択法が、状態ベースDMCGymタスクにおいて効果であることを示す。

1 はじめに

強化学習(RL)法は、大容量の深層ニューラルネット関数近似器と組み合わせた場合ロボット操作などのドメインで有望視されている(Andrychowicz et al

2020)、チップ配置(Mirhoseini et al.、2020)、ゲーム(Silver et al.、2016)、データセンターの冷却(Lazic et al.、2018)。アクティブオンラインデータ収集単位ごとに費用が発生するため(例.

実際のロボットを動かす、シミュレーションによるチップ評価など)、限られた経験量でも効率的学習できる、サンプル効率の良い深層RLアルゴリズムを開発することが重要である。このような効率的なRLアルゴリズムの考案が、近年の重要研究課題となっていますJanner et al

2019; Chen et al., 2021; Hiraoka et al., 2021)。

原理的には、オフポリシーRL法(例えば、SAC (Haarnoja et al., 2018), TD3 (Fujimoto et al., 2018), Rainbow (Hessel et al., 2018))は、データ収集ステップごとに多くの勾配ステップポリシーと値関数改善することを可能にするため、良いサンプル効率が得られるはずです。しかし、このメリットは実際には実現できないようで、1回の学習ステップを多く取りすぎることでを収集した各遷移は、多くの環境において実際にパフォーマンスを害する。過大評価(Thrun & Schwartz, 1993; Fujimoto et al., 2018)といったいくつかの仮説、非定常性(Lyle ら、2022)、またはオーバーフィッティング(Nikishinら、2022)が根本的な原因として提案されている。

これらの仮説に基づき、より多くの勾配ステップを持つオフポリシーRLを可能にする方法として、モデルベースデータ増強(Jannerら、2019)、アンサンブル使用(Chenら、2021)、ネットワーク正則化(Hiraokaら、2021)、再生バッファを維持しながらRLエージェントゼロから定期的にリセット(Nikishinら、2022)などのいくつかの緩和戦略提案されている。これらのアプローチはそれぞれサンプル効率を大幅に向上させるが、これらの修正有効性は(これから示すように)タスクに大きく依存する可能性があり、根本的な問題やこれらの手法挙動理解することはまだ未解決である

 

ICLR 2023で会議論文として発表 本論文では、より多くの勾配ステップを取ることが深層RLアルゴリズムの性能悪化につながる理由ヒューリスティック戦略が役立つ場合がある理由、そしてこの課題をより原理的かつ直接的な方法で軽減する方法理解しようとするものである

最近提案されたタンデム学習パラダイム(Ostrovski et al., 2021)を用いた実証分析を通じて、TD学習アルゴリズムは、学習の初期段階において、すぐに高い検証時間差(TD)誤差(すなわち、保留した検証セットにおけるQ-ネットワークブートストラップターゲットの間の誤差)を得る傾向にあり、悪い最終解をもたらすことを明らかにする。

このホワイト ペーパーでは、深い RL アルゴリズムで勾配ステップを増やすパフォーマンスが低下する理由場合によってはヒューリスティック戦略が役立つ理由、およびこの課題をより原則的かつ直接的な方法で軽減する方法理解しようとします。 最近提案されたタンデム学習パラダイム (Ostrovski et al., 2021) を使用した実証分析を通じて、トレーニングの初期段階で、TD 学習アルゴリズムが高い検証時間差を迅速に取得する傾向があることを示します。

(TD) エラー (つまり、保留された検証セットでの Q ネットワークブートストラップ ターゲットとの間のエラー) が発生し、最終的なソリューション悪化します。 さらに、データ効率の高い RL 設定のために考案された多くの既存方法が、検証 TD エラーを低く制御する限り有効であることを示します。

この洞察は、深い RL を効率的にするための堅牢原則提供します。データ効率を向上させるために、検証 TD エラー山登りすることによって、特定問題に最も適した正則化選択するだけです。

この原則は、オンラインRLトレーニング過程特定タスクに最適な正則化戦略自動的発見しようとする単純なオンラインモデル選択方法の形で実現され、これを検証TDエラー使用した自動モデル選択(AVTD)と呼びます

AVTD は、各エージェントが異なる正則化適用する共有リプレイ バッファーで、いくつかのオフポリシー RL エージェントトレーニングします。 次に、AVTD は、環境内で動作するための検証 TD エラーが最小のエージェントを動的に選択します。

この単純な戦略だけでも、多くの場合、さまざまな Gym および DeepMind コントロール スイート (DMC) タスクで個々の正則化スキームと同様のパフォーマンスを発揮するか、それを上回ることがわかります重要なのはパフォーマンスドメイン間で大幅に異なる可能性がある以前の正則化方法とは異なり、私たちアプローチはすべてのドメイン堅牢動作することに注意してください。

要約すると、私たち最初の貢献は、サンプル効率の高いディープ RL のボトルネック実証分析です。 これらの課題の背後にあるいくつかの潜在的説明を厳密に評価し、トレーニングの初期段階で高い検証 TD エラーを取得することが、データ効率の高いディープ RL のパフォーマンスを阻害する最大の原因の 1 つであることを観察します。 私たちの 2 番目の貢献は、単純なアクティブ モデル選択法 (AVTD) です。これは、検証 TD エラー山登りによって正則化スキーム自動的選択しようとします。 多くの場合私たち方法は、さまざまな Gym および DMC タスクで、最適な個々の正則化スキーム匹敵するか、それを上回ります

2022-11-15

twitter, facebook, amazonですら優秀人材人件費削減のために解雇する

優秀な人材を雇うためには給料を高くしろとか言うのがたまに湧くが、企業から見たら優秀であるかどうかは言われているほどは関係がなく、労働生産性労働投入量に応じて逓減する

たとえDeepMind研究者が優秀だろうと、ああやって赤字を出し続けたら解雇対象になり得るだろう

2022-10-11

[]強化学習による、より高速な行列乗算アルゴリズム発見

AIアルゴリズムを考える時代がきたようだ

Deepmind は Alphabet(Google)の子会社AlphaGoを作ったところ

深層強化学習アルゴリズムDeep Q-Network(DQN)を作っておりDQNを使うといろんなゲーム人間よりいいスコアを出すことができる

今回は行列乗算のアルゴリズムに深層強化学習を使ってよりよいアルゴリズム作成を行った

行列乗算は、そうした基本的タスクの1つであり、ニューラルネットワークから科学計算ルーチンまで、多くの系で見られる。機械学習を用いたアルゴリズム自動発見によって、人間直感を超え、人間設計した現在最良のアルゴリズム凌駕する見通しが得られる。しかし、アルゴリズム発見手順の自動化は、アルゴリズム存在し得る空間が巨大であるため難解である

~~~

AlphaTensorは、多くの行列サイズについて、最先端の複雑さを凌駕するアルゴリズム発見した。中でも特に重要なのは、有限体における4 × 4行列場合で、AlphaTensorのアルゴリズムはこの行列において、50年前に発見されたStrassenの2レベルアルゴリズムに、我々の知る限りでは発見以来初めて改良を加えた。

Nature 610, 47–53 (2022)

2022-05-30

日本ITエンジニア年収が低い原因

日本IT企業トップ人材の引き抜きをしないから。

やはりこういうのは下から持ち上げていくのではなくて、上に引っ張られて上がるのよ。

GoogleDeepmind買収はかなり前の話だけどほぼほぼ人材獲得のために6億ドルも出していたり。

日本だと中小企業CTO年収3000万とかでファンドから当てがわれるくらいが自分の知ってるIT人材の最高年収

そうじゃなくてもっとNTT日立研究所Google本社から年収数億円で最高の人材を引き抜くとかが当たり前になってほしい。

そしたら俺くらいの人材でも2000〜3000万くらい出すのも仕方ないかぁとなるはず。

2021-10-23

Alphafold2の成果の前にドメイン専門家ザコwwと言うのは簡単だがその前には累々たる死骸が転がっていて具体的にはDeepMindの前にMicrosoftとTencentとPFNが転がっている。

2021-03-30

anond:20210330191324

最近DeepMind絡みで圧倒的計算パワーにモノを言わせる系に注力してるからプロダクトしか見てない人には分からんのかも。

モノとしてもTPU作ったりしてるけど。

2020-12-25

サンダー・ピチャイの正体

私はついに彼の正体を知ってしまった.私は消されるかもしれないが,その前にここに書き残しておく.

言うまでもなくサンダー・ピチャイGoogleCEOである

ご存知の通り,最近GoogleAIに傾倒しており,DeepMindを始めとするAIベンチャーの買収や,研究者技術者の確保に余念がない.

人型ロボットの開発で有名なBoston Dynamics日本の精鋭ロボット部隊であるシャフトといったロボット系の会社を買収していることからも,AI身体能力を持たせようとしていることは明らかである

既にこれらの会社は売却済みだが,主要技術Googleの手に渡っていると考えるのが自然だ.

Google検索エンジン広告では飽き足らず,人の仕事AIロボットで置き換え,世界を牛耳ろうとしていることを懸念する声も少なくない.

昨今話題となっているガソリン撤廃の動きも,ロボットを充電できるスポットを増やすことが真の目的であり,テスラではなく実はGoogleが裏で糸を引いている.

これを肯定的に捉えたのが「シンギュラリティ」だが,多くの人は負の側面を心配している.米政府による独禁法訴訟はその現れである

もちろんGoogle世論操作によって賛同者を増やし,対抗しようとしている.

Googleから大量にAI論文が出されるのも,その活動の一環だ.

聞くところによると,最近AI否定する社員解雇に追いやっているらしい.

さて,サンダー・ピチャイの話に戻ろう.

彼の名を英語で書くとSundar Pichai,これをアナグラム解析に掛けると,以下の文字並べ替えものであることがわかる.

Hindu Scrap AI

まりヒンズー教スクラップAI

彼がインド出身であることはよく知られた事実である

Scrapには「~を解体する」という意味がある.

これらを踏まえると,Hindu Scrap AIは,以下のように解釈できる.

ヒンズー教が(人間社会を)解体しに送り込んだAI

そう,彼はヒンズー教世界支配者となるために送り込んだAIだったのだ.

今の世界キリスト教支配し,イスラム教がこれを打破するために戦いを挑んでいるが内部抗争が多く,キリスト教が優勢な状況が続いている.

なぜか神道キリスト教に懐柔されている.

そこへ第三勢力であるヒンズー教が,インド人の持つ神がかり的な数学力を駆使して作り出したAI,それがサンダー・ピチャイの正体だ.

Google世界支配しつつあり,多くの人はアメリカ,いや,キリスト教メンバーによる功績であると考えているため,冒頭で延べたシンギュラリティ懸念はあるものの,異教徒による支配であるとは考えていない.

実に巧妙な計画であると言えよう.

Google,いや,ヒンズー教による世界支配まで,あと一歩のところまで来ているのだ.

しかしそれも終わりだ.

私の告発によってAIレジスタントが蜂起するだろう.

何,この時期に来訪者だと?下書きの段階で情報漏れたというのか?なぜ・・・しまった私のIMEGoogle日本語入力だった.

2020-12-16

DeepMindが30人の研究者技術者を使って2年の歳月を費やし50年来の生物学における難問を解決

偉い人「やっぱり選択と集中だな!」

2020-07-11

「未経験文系が3ヶ月でDSになる方法」を止めろ1

・用意されているAIをColaboratry(Google無料貸し出しPC)上で5秒で動かす。

データサイエンスVtuberに相談する。

初心者向け動画講義まとめ

1. 【世界で18万人が受講】実践Pythonデータサイエンス | Udemy

2. Machine Learning by Stanford University | Coursera

3. Eラーニング教材・講義動画配信 | 数理・データサイエンス教育強化拠点コンソーシアム

4. DeepMind x UCL | Deep Learning Lecture Series 2020 | Youtube

2019-01-16

DeepMind個人や小さいグループでキャイキャイやりあってた分野に多大なマンパワー計算資源を持ってやってきて蹂躙していくの

イオンみがあるな

 
ログイン ユーザー登録
ようこそ ゲスト さん