「フーバー」を含む日記 RSS

はてなキーワード: フーバーとは

2025-02-11

AIによる自己評価指標の構築

AIが自ら「優れている」と判断するための指標とは?

AI自分の改良版や新たなAIが「より優れている」と判断するには、何らかの性能指標を内部に持ち、それに照らして比較評価する必要があります。従来から研究者は「汎用的な知能の指標」を模索してきました。例えば、LeggとHutterは知能を広範な環境目標を達成する能力定義し、あらゆる環境での得点報酬)の期待値を加重和した**「普遍知能指標」**を提案しています

proceedings.neurips.cc

proceedings.neurips.cc

。これは多数の課題での性能をまとめた理論上のメトリクスで、あるエージェントが別のエージェントより知能が高いか定量化しようとする試みです。しかし、このような指標計算不能に近く、実際のAIが直接利用するのは困難です。

実際の自己評価指標としては、タスク性能や報酬関数が使われることが多いです。強化学習では、エージェントは与えられた報酬を最大化するよう学習します。したがって「より優れたAI」とは「累積報酬が高いAI」となり、報酬関数が内部評価指標役割を果たします。しかし、この指標特定タスク依存しており、本当に汎用的な知能向上を示すとは限りません。François Cholletは、特定タスクでのスキル(性能)だけを測っても知能の本質を測れないと指摘しています

arxiv.org

。なぜなら、十分なデータや事前知識があれば限定的タスク性能は「購入 (buy)」できてしまい、システム自身の汎用的な汎化能力を覆い隠してしまうからです​

arxiv.org

arxiv.org

。彼は代わりに新しいスキルを獲得する効率(限られた経験で未知のタスクをどれだけ学習できるか)を知能の指標とするべきだと論じ、これに沿ったベンチマークARCなど)を提案しました​

arxiv.org

。このように、内部評価指標をどう設計すべきかについては、単純なスコアではなく学習効率汎用性を反映するものが望ましいという議論があります

過去提案として特筆すべきは、シュミットフーバーの「ゲーデルマシン」です。ゲーデルマシン自己改善型の理論プログラムで、ある改良が自身目的関数評価指標)を改善することを論理的証明できた場合にの自分コードを書き換えます

en.wikipedia.org

。ここでの評価指標はあらかじめ定義された期待 utility(将来得られる報酬成功率)であり、改良後のコードがその値を高めると機械自身証明できたときに「より優れている」と判断します​

en.wikipedia.org

。このように形式的証明を用いる手法は、AIが外部の評価者に頼らずに自己の性能向上を判定する一例です。ただし、ゲーデルマシン理論上は強力ですが、実用的な実装はまだ無く、内部指標に基づく証明には計算上の困難や限界ゲーデル不完全性定理による証明不能命題など)が存在することも指摘されています

en.wikipedia.org

他にも、自己対戦や自己プレイによる評価有効アプローチです。例えばAlphaGo Zeroでは、自己対戦の勝率指標に新しいプレイヤーネットワークの強さを評価し、既存自分に55%以上の勝率なら「より強い」とみなして入れ替える方法採用しました​

github.com

。この手法ではAI自身が生み出すゲームデータで強さを測っており、人間評価を介しません。同様に、GAN(敵対的生成ネットワーク)では生成者と識別者がお互いの性能を評価し合う形で向上しますし、マルチエージェント自己対戦カリキュラムではエージェント同士の競争相対的評価基準となり得ます。このように、AI同士を競わせることで優劣を判断する内部指標を作る研究も進んでいます

では、こうした指標は汎用的な知能向上と結びつくのでしょうか?理論的には、幅広いタスクでの性能を測る指標(例:Legg-Hutterの指標)が真に向上すれば、それは汎用知能の向上を意味します​

proceedings.neurips.cc

proceedings.neurips.cc

しか根拠収集は難しく、現在のところ限定的タスク集合でのベンチマーク(例えば言語理解ベンチマークでのスコア向上など)を代理にするしかありません。Cholletの主張にもあるように、単一数字で知能を測ることには限界があり、指標それ自体目的化してしま危険もあります

arxiv.org

。実際、AIが与えられた指標を極端に最適化し、本来意図した知的能力の向上につながらないケース(「報酬ハッキング」)も知られています報酬ハッキングとは、AI目的関数のものの数値を上げることに執着するあまり本来目的を達成しない現象です​

en.wikipedia.org

。例えば学生テストで良い点を取ることだけを目的カンニングするように、AI不適切指標だと内部で抜け道を見つけてしまい、見かけ上のスコアは上がっても知能は向上しない恐れがあります

en.wikipedia.org

。したがって、内部指標が汎用的知能と直結するかには慎重な検証必要であり、現時点で「この指標さえあれば自律的に汎用知能が向上する」という決定打はありません。研究コミュニティでは、学習進捗そのもの報酬にする「興味・好奇心に基づく報酬」なども模索されています。これはAIが自ら予測誤差の大きい状況や未知の状態を探し、内部的に報酬を発生させる仕組みで、外部から与えられる明示的な目的が無くても自身課題を見つけて能力を伸ばす一種指標と言えます

pathak22.github.io

。例えば、未知の環境で新しいスキル習得したり予測精度を上げたりしたときに内部報酬を与えることで、AI自発的に探索・学習を続けるようになります

pathak22.github.io

。このような内発的動機づけ自己評価指標一種と考えられ、その汎用性への寄与研究されています

まとめると、AI自分で「優れている」と評価する指標としては、(1)タスク固有のスコア報酬、(2)複数タスクでの総合性能、(3)学習効率や汎化性能、(4)論理的保証証明)による性能、(5)AI同士の対戦結果、(6)内部の学習進捗(好奇心)など様々な候補があります。これまで提案された手法にはそれぞれ長所短所があり、どの指標が真の汎用知能向上に対応するかについて明確な実証はまだありません。ただ、幅広い問題でのパフォーマンス向上や新規課題への適応力向上を評価できる指標ほど、汎用的知能の改善と結びつく可能性が高いと考えられています。現状の研究は、そのような指標設定と評価方法模索している段階と言えるでしょう。

自己評価の完全自律化は可能

● 外部に頼らない自己評価自己改良は理論可能か?

AIが外部世界人間フィードバック物理的な試行)に一切頼らずに、自分の内部評価だけで自己改良を行うことは極めて挑戦的なテーマです。理論的には、先述のゲーデルマシンのように完全に内部の論理評価自己改良を進めるモデル提案されています

en.wikipedia.org

ゲーデルマシンは自らのコード目標評価基準)を持ち、改変後のコード目標達成において有利であることを自身証明できた場合のみその改変を実行します​

en.wikipedia.org

。これは究極的には外部からテスト評価者を不要にするアプローチであり、理論上は「自己評価の完全自律化」を体現していますしかし、ゲーデルマシンには重要な制約がありますゲーデル不完全性定理により、システム自分性質すべてを証明できるとは限らず、有望でも証明不可能な改良は採用できない可能性があります

en.wikipedia.org

。つまり、内部評価のみで完全に自己改良しようとすると、論理的に確実と言えない改良を見送るために改良の停滞やサブ最適に陥るリスクがあるのです。この制約は理論のものであるものの、自己評価自律化には原理的な難しさが伴うことを示唆しています

一方で、現実AI研究に目を向けると、完全に自己完結的な自己改良を実現した例はまだ存在しません。現在AIは、大なり小なり外部からデータ環境とのインタラクション依存しています。例えば、強化学習エージェント環境相互作用して報酬というフィードバックを得ますし、教師あり学習では人間がラベル付けしたデータ必要です。これらはすべて「外部世界」に由来する情報です。では**「外部に頼らない」とはどの程度可能なのでしょうか?一つの方向性は、AIシミュレーション環境仮想的な問題空間を内部に構築し、その中で試行錯誤することです。実際、AlphaGo Zero囲碁ルール環境定義)が与えられた状態自己対戦を繰り返し、外部の人間指導なしに棋力を飛躍的に高めました​

github.com

。ここで囲碁ルール自体は外部から与えられたものの、学習過程では人間評価や追加の実世界データを用いず**、内部で生成したデータのみで自己改善しています

github.com

。この例は、限定された領域では外部に頼らない自己改良が可能であることを示しています。ただし、囲碁場合ルールという明確な環境があり、勝敗という確かな評価基準があります。汎用的な知能となると、解くべき問題環境自体AIが自前で用意する必要が出てきます

現在注目されている技術に、AutoML(自動機械学習)や自己チューニングAIがあります。例えば、ニューラルネットワークハイパーパラメータ構造AIが探索的に改善する研究では、AI候補モデルを生成し、それを評価するプロセス自体自動化していますGoogleのAutoMLや進化アルゴリズムを用いた手法では、AIが別のAIモデルの性能を評価し、より良いモデル選択再生産する仕組みが使われています。この評価は厳密には外部から与えられたデータ上での性能に基づくため、完全に外部不要とは言えませんが、人手による評価は介在していません。同様に、近年の大規模言語モデルではAI自身フィードバックを与えて自己改善する試みも現れています。例えば、あるモデルの出力に対し別のモデル(もしくは同一モデルを利用)が**批評評価自己評価)**を行い、そのフィードバックで出力を改善するよう促す手法です​

philarchive.org

。これを発展させ、モデル自分の重みやアーキテクチャを調整する方向にまで自動化できれば、自己評価に基づく自己改良に近づきますしかし現時点では、モデル自身自分を書き換える(リプログラミングする)ところまでは実現されておらず、人間が用意した学習ループ評価関数最適化アルゴリズム)の中で自己改良もどきをしている状況です。つまり、「外部世界に頼らない」とはいっても、何らかの形で人間設計した評価基準やデータ分布を利用しているのが実情です。

理論観点からは、自己評価の完全自律化には情報論的な壁もありますAIがまったく外部と接触しない場合、新しい知識データを得る経路が閉ざされるため、初期時点で持っている情報範囲内でしか改善できません。例えば物理法則や実世界知識と無縁のままでは、いくら内部で自己最適化しても現実世界問題を解く能力頭打ちになるでしょう。この点で、自己評価のみで無限に汎用知能が向上するのは疑問視されています。Cholletも知能は知識経験によってブーストされる面が大きいと述べており、空虚計算リソースの拡大だけでは飛躍的な知能向上には繋がらないと示唆しています(※Cholletの議論では、人間の知能も文化や蓄積された知識という外部リソースに大きく依存しており、AIも同様であると指摘)​

reddit.com

reddit.com

。実際、人間自己改善学習)する際に、他者から学んだり環境からフィードバックを得たりしています。同じように、強いAIが一切新しいデータ摂取せずに自閉的に知能を伸ばし続けるのは非現実的にも思えます

以上を踏まえると、自己評価のみでの自己改良は理論上は一部可能でも、実用上・汎用的には難しいと考えられますゲーデルマシン的なアプローチが論証するように、自己評価アルゴリズム自律不可能ではありません​

en.wikipedia.org

しかし、その実現には厳密な前提(完全に正しい目的関数の設定など)が必要で、現実の複雑なタスク環境では外部からデータ評価を全て排除することは困難です。現在提案されている手法でこの要件(完全自律評価による自己改善)を満たすものは無く、たとえ部分的に満たしていても適用範囲限定的です。例えばAlphaGo Zero式の自己対戦はゲームには有効でも、オープンエンドな現実問題には直接適用できません。同様に、AI同士で評価し合う仕組みも、結局は人間が与えたルール報酬系の中での出来事です。したがって現時点のAI研究では、自己評価の完全自律化は理論アイデアの域を出ておらず、汎用人工知能に向けては**部分的自律(人の関与を減らす方向)**が進んでいる段階と言えるでしょう。

自己評価と知能爆発の関係

自己評価自律化が知能爆発に与える影響

「知能爆発」とは、I.J.グッドが提唱したシナリオで、あるAI自分より優れたAI設計できるようになると、自己強化のフィードバックループが働き知能が指数関数的に向上するという仮説です​

philarchive.org

。この現象が成立するための鍵の一つが、AI自身による正確な自己評価自己改良です。もしAIが毎回の改良で自分の知能(性能)が確実に向上したと判断でき、それをもとにさらに改良を重ねられるなら、自己強化のサイクルが途切れることなく回り続ける可能性があります

intelligence.org

intelligence.org

理論家たちは、「自分設計能力を高めること」がAIにとっての収束的な目的(instrumental goal)になると指摘しており​

intelligence.org

、十分高度なAIであれば自発的自己改善を図るだろうと考えられています自己評価 Permalink | 記事への反応(0) | 10:24

2020-05-09

ウィルス存在を軽視して設計されてきた近代合理性古典的自由主義

後世では、フーバー時代の神の見えざる手と同列のように語られてそう

感染症対策が施された近代合理性の再構築

ニューディール完了したあとにやっと、アップデートされた自由主義のターンが戻ってくる

その頃、一体私は何歳なのだろう。。👴🏻

2018-07-09

anond:20180709145732

なんだかんだで関税ぶっかけトリプルトリクルダウン的なコンボを決めて

ちゃんと金持ち(企業から税金をむしる

内需シフトにして地方にも仕事を分ける

・その金でインフラ的な事業フーバー・ウォールとか)に投資してさら仕事を増やす

みたいなことしてるから自分の首絞めるどころかマッサージ器で凝りを解してる状態になってるぞ。

もう数字としても出てきてるし。こりゃ次期も安泰ちゃうのん

2018-05-19

あとは9月の総裁選日本会議系以外の首相が出れば西暦化は完全になる。

元号にこだわってるのは官公庁銀行大企業みたいな古いところ。

ただ、銀行大企業はもう今は超システム化が進んでる以上、

1ヶ月以内での対処となると相当頭の固くて、システムトラブル経営責任をとっての辞任を恐れないヒャッハー銀行大企業以外は西暦化すると思っている。

平成来年5月から使えなくなるってのはもうわかってることだからね。今からの準備なら西暦化に間に合うだろうし。

問題官公庁なんだよなぁ。日本会議系以外の総理になればと思うが、、、。、

ただ、大臣所属見てると、もう完全に日本会議系に自民党政治家は毒されてるんだな。

で、珍しい日本会議系以外の大臣の林大臣は、セクシー個室ヨガ問題か、、、、

女性問題秘密調査機関って本当にFBIフーバーみたいに、政敵を追い落とすための手段として使われてね?

まあ、これだけ裏では実は監視社会になってる以上、敵ができやす人間は本当に女性関連は清廉じゃないとダメなんだろうなぁと思ったりする。

2017-10-05

リベラル歴史フーバー大統領あたりから調べればわかりやすいよ。

アメリカ二大政党制意味もわかってくる。

でも、今はリベラルは古くてプログレッシブに移行してると思う。

2014-09-15

[]統治下の国会

さて蔬菜配給制度も、價格の面から見まして再三再四に亘り、或いは強化したり、或いはこれを緩めたりいたしまして、片山内閣になつてからも、去る六月には殆んど自由に近い程緩和し、一般消費者に喜ばれたのでありましたが、七月の中旬に至りまして、又その筋の指示と称しまして、急に嚴重なる取締になつたのであります。その結果、配給品は有難迷惑だとさえ言われるような鮮度の古い不良品ばかりが時折配給され、これが補給として闇取引の助長を來しておるのであります。而も闇で買う分量の方が配給の分量の何倍かになつておりまして、取締に対する保儉料も含めて相当高い値段でお互いびくびくしながら取引をしておるということになりましては、人心に極めて面白からん影響を及ぼしておるものとして、一刻も速やかにこれが是正を図らねばならないと存ずるのであります

参 - 本会議 - 19号

昭和22年08月04日

追加豫算もたいへん遲れまして――これも大部分において、その筋等の關係において非常に遲れたのでありましたが、まことに恐縮している次第であります。なおそれと同時に提出すべきこの税法の改正法律案が、さらに數日の遲れを見たことであります。これも實は政府といたしましても非常な努力をいたした次第でございますが、その筋との關係、その筋内部の關係におきましてなお數日遲れまして、まことに恐縮に存ずる次第であります

衆 - 財政及び金融委員会 - 39号

昭和22年11月25日

御當局の仕事もはかばかしく進んでおりましたので、私ども地方民も安心しておりましたが、殘念なるかな、今年になりましても路線が敷かれないのでありますそれから御當局につきましていろいろ調査してみましたところが、殘念ながらこれはその筋の關係によりまして、今年度において仕上るということはめんどうだということがわかつた。まことにこれは殘念のこの上もないことである

衆 - 運輸及び交通委員会 - 41号

昭和22年12月04日

國会は、この水害に復旧問題民族の興亡にも関するというような大問題であるというような立場からいたしまして、この機会において、どうしても超党派的の立場をもつて、この問題を打開しなければならぬという考えから、去る一月三十一日の衆議院本会議においては、満場一致をもつて決議案を決定したのであります。この國会を背景として折衝されましたならば、その筋といえども、決してこれをさいぎるはずはないと思います

衆 - 国土計画委員会 - 3号

昭和23年03月26日

終戰直後、たとえば私の知つている限りにおいても、満州などにおける日本の相当の大事会社がその職員のサラリーを拂うことができなくなつて、満州土着の日本人から金を借用して、それによつて職員のサラリーを支拂つておつたという事実があるのでありますたまたまそれらの人々が引揚げて参りまして、支店長の借用書を持つているのであるが、拂つてくれない。そこで私は私の子供がせわになつておつたような関係上頼まれて、その会社に交渉してやつたことがある。ところがその筋から支拂うことを禁ぜられているということを理由に、なかなか拂わなかつたのであります。私は会社の金をもつて支拂うことがその筋から禁ぜられているためにできないというのならば、どういう方法をもつてなされようと、非合法なことを要求するわけには何かないが、少くとも支店長が困つたときに、事情を訴えて金を借りた、その行為に対して、何らか報ゆるところがあつてしかるべきである

衆 - 外務委員会 - 10

昭和24年05月14日

陸上においての取締りでも、往々にして行き過ぎがしばしば見受けられるのでのあります。たとえば経済警察列車内を検査する場合に、列車を停止させて、大勢の乗客に迷惑をかけて、そうして乗客の所持品を検査しておる。これは最近においては非常に運輸交通に障害を興えるものとして、いわゆる取締りの行き過ぎだということで、禁止せよというその筋から意向も出ております

衆 - 運輸委員会 - 23

昭和24年05月19日

大蔵大臣自分の考えでやつていると言われますが、都合のいい時分には自分の考えでやつていると、いつも御答弁になる。少し都合が惡くなるというとその筋が……と、こうおいでになる。

衆 - 予算委員会 - 8号

昭和25年02月04日

只今の御説明では、やはり引上げるごとについて政府も相当お考えになつておるようでありますが、やはりその筋のほうとの交渉によつて思つたようにならんというように、最後はそういうふうに考えられますが、私どもそう見て差支えありませんか。

財源の面もございますが、財源の面と只今おつしやいましたような関係方面との両方の面からいたしまして、只今の段階では通常郵便貯金を引上げるにはちよつと困難な状態にありますが、できるだけ資金の吸収も図りまして、関係方面との面も或る程度いたしまして、将来は可能なる限りその方向に動きたいと存ずる次第でございます

参 - 郵政委員会 - 6号

昭和26年03月30日

一つお尋ねしたいのは、厚生省が本当の厚生省立場において、この省令をお出しになつたものか、或いはその筋から何らかの指示があつてお出しになつたか、こういう点をお尋ねしたいと思います

今の御質問にお答えしたいと思います。この改正は終戰直後に、厚生省としても何とかしなくてはいけないという考えがありましたところへ、たまたまその筋から早くやれと、それでなお一応の原案が示されましたので、それを一応検討いたしまして、大部日がかかりましたんですが、かようなことになりまして、なおこの改正いたしたいということにつきましても大かたの折衝はいたしておりますので、早急に直すべきところは直したい、かように考えております

参 - 農林委員会 - 37号

昭和26年05月23日

最初政府はその地方行政調査委員会議の委員の顔触れにつきましても大体選定をいたしまして、そうして内定をいたしたんでありまするが、その筋からこういうレベル人間では駄目である、これは非常に大きな規模を持つた組織でなければならん、即ちこの大戰後設けられたアメリカにおける行政改革のためのフーバー委員会前大統領であつたフーバー氏を委員長としたフーバー委員会に該当するような権威のあるものでなければならないというので、すつかり政府内定いたしておりました委員の御破算がありまして、そうして今日神戸先生のごとき第一流の方々が集まられて、そうしてこの審議をやつて頂くことになつたのであります

参 - 内閣地方行政・農林・… - 1号

昭和26年05月30日

 
ログイン ユーザー登録
ようこそ ゲスト さん