2006-07-01から1ヶ月間の記事一覧

トラックボール

今使ってる奴がもう寿命なので、そろそろ買い換えたい思っている。これとかどうだろう。 http://mineko.fc2web.com/box/tb-room/items/kensington-expert-mouse5.html トラックボールはゴロゴロ音がするくらいがちょうどいい抵抗だと思う。そして巨大な玉。…

日中暑いので寝て過ごす

ほらほら砂漠でのサバイバル技術として、穴掘ってビバークみたいにして日中は体力を温存するっていうのがあったじゃないですか(弁解) はてなアンテナの使い方を今更知ったので日頃巡回しているサイトを登録しまくっている。これは便利かもしれんね。明日の…

今日は暑かった

今日も研究室に行ったのだが、昼過ぎであったため異常に暑かった。なんかもう日差しに悪意を感じる。今度からは朝のうちに行こうと心に決める。 しかし学校へ行くと研究室の人達とだべってしまって全然進まないということに… そもそも研究の方針を固めるため…

階層型の学習システム

に関する論文を色々物色している。ほとんど数学だ。ひいい 日本語の論文でも理解に苦しむのだから、英語の論文となるともうなにをかいわんやである。 ちょっと要点だけまとめてみる。 動機 主に学習の高速化 状態数の削減 現状 離散環境での階層化は既に結構…

ボトムアップな日本語

日本語, 好きですか? また総じて,英語の語順も,文章の構成法もトップダウンである.I do not believe that ... と会議で切り出すと,ふっとみんなの視線が集まるのがわかる.語順がそのような焦点を明確にするところがあるのである.ところが日本語は(強…

継続

Schemeのcall-with-current-continuationの使い方はなんとなく分かったんだけど、OnLispの継続の章のマクロが何をするものなのかがよくわからんぜ! Common Lispでマルチプロセスをやりたいのだけど・・・

起きたら13時だった

これはもうダメかも分からんね

今日やったこと。

卒論の中間発表が近いので火曜までにプレゼンの用意をしておけと言われる。一晩あれば書けると信じて今日はnステップTDからTD(&lambda)までの理論を調べていた。 TD(&lambda)は結局のところ1-step-returnからn-step-returnまでの全ての収益に対して0≦&lambda…

NAISTから合格通知がきたよ

しかも「あなたは非常に優秀な成績で合格されたので云々・・・」とかいてある。あれれおかしいなギリギリだと思ったんだがな。成績優秀者は優先的に入寮できて第一種の奨学金を受けられるらしい。うほ。無利子はかなりありがたいです。 入学意志確定の為の書…

デスノート12巻

DEATH NOTE (12) (ジャンプ・コミックス)作者: 小畑健,大場つぐみ出版社/メーカー: 集英社発売日: 2006/07/04メディア: ペーパーバック購入: 1人 クリック: 95回この商品を含むブログ (516件) を見る昨日買ってきてたやつを読んだ。さんざん言われていたこと…

エージェントアプローチ 人工知能 を読む

エージェントアプローチ 人工知能作者: スチュワートラッセル,ピーターノーヴィグ,Stuart Russell,Peter Norvig,古川康一出版社/メーカー: 共立出版発売日: 1997/12メディア: 単行本購入: 2人 クリック: 48回この商品を含むブログ (21件) を見るカテゴリつく…

Robocup3D

その後学校へ行った。 学生プロジェクトでお金を貰えたらしいrobocupのシミュレーションリーグをやっているチームがあって、そこの3年生のノートにGentoo-Linuxと、portageになってるRobocup3Dのシミュレータをインストールしてあげて帰ってきたら21時。一…

NAIST合格

10時発表だった。一時間前からそわそわ。時間ちょうどにNAISTのHPのトップに出る。見る。 あったよ!クララがあったよ! 発表で浮かれているところに速達で東工大の受験票が届いた。研究内容の点で奈良が第一志望だったこともあり、指導教官と相談した結果…

Xのネットワーク透過性を使ってマルチディスプレイを実現する。

要するに他のPCへX-Windowを転送して、さらにそこを転送元から操作しようということ。 まず、転送先PCのxhostで転送元のアドレスを登録しておく。 転送元PCにx2xをインストールする。これで転送元のキーボードで転送先のX-windowを操作できるようになる。 $ …

プレ中間発表を控えて

卒業研究にあたっては中間発表があるが、うちの研究室では二回やるらしい。8月の頭にプレ中間発表、10月には中間発表、来年2月に卒研発表の本番がある。プレ中間では選択したテーマの周辺を説明して今後のロードマップを示すという感じだけど、この三ヶ…

on-policyとoff-policy

Suttonの教科書に良く出てくる表現で、学習の過程で方策の評価、改善が行われるものをon-policy、そうではないものをoff-policyと呼ぶ。on-policyの手法としては動的計画法*1やSarsaがあり、off-policyの手法にはQ-learningがある。Q-learningは価値の更新を…

NAIST受験

奈良の空は青かった… 昨日のことだけど、NAIST*1受けてきました。昼過ぎ奈良に到着。大学までのバスが一時間に一本しかない。異様に暑い。大学までバスに揺られること三十分。着いた。キャンパスには人が少なかった。NAISTの試験は面接のみであるため、四日…

â– 

あ、ありのまま起こったことを話すぜ!

動的計画法

先達が「方策勾配法による状態空間の削減」というものを研究しておられるようなので、それを利用して階層化を試みる。少ない状態空間による学習を上位層に置いて、下位層の具体的な学習に影響を与える。方策勾配法が非ブートストラップ手法*1なので下位層に…

ほぼ一ヶ月ぶりですなw

ここ一ヶ月の間は受験勉強に費やすという目標を達成できたかどうか… なんにせよ13日にNAISTの口頭試問なのでリアルでガクブルである。プレゼンテーションで何を話すか決めないといけない。マンマシンインターフェースにおいて人間からだけでなく機械の方か…

â– 

研究室のホワイトボードの落書き。愚夫。 はてなダイアリーって画像をうpしても小さく角に出るのみだったんだけど仕様が変わった?みたい。はてなフォトライフというのが使えるようになってる。便利な時代になりました。せっかく携帯にカメラついてることだ…