サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Switch 2
aaaazzzz036.hatenablog.com
あっ, どーも僕です。 Rでk-means法とその拡張の最後は, 改良k-meansです。 概要は前々回の記事をみてください。また, アルゴリズムは論文をみてみてください。フリーで入手できます。 さっそく, 結果ですが, クラスター数を3にしたときがこちら。相変わらずirisを使います。色がクラスタリングの結果で, 記号はSpeciesで分けています。うまくクラスタリングされたことがわかります。 改良k-meansはどうやらRで実装されていなさそうなので正しく実装できているかは, 論文と結果を比較してみました。比較したところ, 問題なしです。論文では, 3つのデータがクラスタリング失敗していますが, グラフをみると, オレンジの三角が2つと緑の十字がひとつあることがわかります。 k-meansを多変量正規分布で修正するだけで, こんなにもすごい結果がでるのですね。すごい。 で, 問題なしと
あっ, どーも僕です。 先週, 「明日から頑張る」と宣言したはずの後輩が, その日から一度も研究室に来てくれません。 まだ, 卒論に書くことないがほとんどはずなのに..... 先輩としてどうしたらいいものか。 k-means法によるクラスリングの拡張 k-means法とその拡張が実装できたのでご紹介。 k-meansとは k-means法とは, 非階層のハードクラスタリングで, 様々な本で紹介*1されています。 改めて説明する必要もないくらいによく出てきます。 特徴としては次のことがあげられるそうです。 実装が簡単 高速 アルゴリズムはなにか本を参照してください。 ちょっと物足りない点としては次があげられるそうです。 最適なクラスター数が決める基準がない 変数の相関を考慮できない そんな, k-meansはいくつか拡張されたものがあります Fuzzy c-means x-means*2 変
あっ, どーも僕です。 注意!!本エントリーの記述はRソースを含めて全面的に書き直しています!!(なぜかこのエントリーはアクセス数が多いので(汗))@2014/9/11 Python版はこちらから. github.com クラスター数が自動で決まるkmeans法 前回はk-means法の実装を示しました。 kmeans法は近い者同士を集めるという直感的に理解しやすいシンプルなクラスタリングですが、そのシンプルさゆえにいくつか欠点(?)があります。 その一つはクラスター数の設定です。 kmeans法ではクラスター数をパラメータとして与えます。...しかし、どうやってクラスター数を設定するればよいのでしょう。...わかりません。職人芸でしょうか。 素人にはクラスター数は決められないでしょうか? 考えるめんどくさいのでアルゴリズムに決めてもらいたいです。 そんなクラスター数をアルゴリズムに決めて
水着よりもいまは浴衣姿を拝みたい. あっ, どーも僕です. みなさんこちらの記事見ましたか? Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 道玄坂で働くデータサイエンティストのブログ Rをはじめて一年あまりだそうです. すごいですね. わたしなんてもうまる二年Rを使っているのに半分くらいしか数学的にもR的にもわかりませんでした. お恥ずかしい. .... まっ, それはおいといて. 記事を読んでいて思ったのですが, Webの世界ではあまりタグチメソッドは使われていないようですね. タグチメソッドも結構使えそうな気もするだけどなあ. ってことで, 今回はタグチメソッドのMTA法を組んでみてirisで試してみました. MTA法はパターン認識の一種で, 何がいいかはわかっているけど, 何が悪いかわかっていないときに有効です. なにでパターン認識するかというと正
塩には必要だが。 あっ, どーも僕です。 来年から おかげさまで、来年からの食い扶持が決まりました。 特に@beroberoさんは見ず知らずの私に声をかけてくださりありがとうございました。励みになりました。 内定先ではデータ解析とかとはあまり関係ない仕事かもですが、分野としては志望通りで一安心です。 Rで普通の数値解析 近頃というか、前々からのですが、これからのためには普通の数値解析をちゃんと実装したことほうがいいのでわと感じていました。 そこで、今回はRを使ってですが普通の数値解析を勉強しました。今週を使ってコツコツやりました。ただ、ここで実装したのはすべてRで提供されていますのであくまで自分の訓練用です。 それなら、せめてRcpp*1使えって話ですがRcppの教科書は一回しか読んでなくてまだ使いこなせていのでやめました。 教科書はこちら。 数値で学ぶ計算と解析 作者: 金谷健一出版社/
なのでダンダリン見てる。 あっ, どーも僕です。 リアップは劇薬じゃなくてよかったです。 rstanでちょこちょこ こちらのブログにrstanの導入&入門編が紹介されていました。 MCMCの計算にStanを使ってみた(超基礎・導入編) - 銀座で働くデータサイエンティストのブログ 普段から読んでいるブログで毎度毎度参考になります。 ですが、はじめてrstanを触る人には誤解を与えるかもな内容でしたので、ちょっと付け足しておきます。 付け足しポイントは次の2つ 回帰係数にはベクトル演算をつかうstanはいっぱい関数があってよくわからないので, まかせます codaを使わなくてもトレースと事後分布は出せる ベクトル演算は公式リファレンスで推奨されていますし、ひとつづ係数を書くのは大変なのでオススメしません。 書いて説明するのは大変なので、とりあえずRのスクリプトはこちら。リファレンスに似たよう
あっ, どーも僕です。 Stan2を使って自分もベイジアンの端くれになりたいのですが、RStanがなかなかインストールできずに苦戦していました。 インストール失敗のエラーメッセージは自分には理解できなったです。 で、試行錯誤していたらいきなりインストールできたので同じ悩みを抱えているかたの参考になればと思い載せておきます。ちなみに、stan1.3のときにはrstanをインストールできませんでした。stanそのもののはすんなりインストールできましたが。 追記 2013.10.26 2.0.1のインストールとか リファレンスを全文印刷したとたんにバージョンアップしてしまいました。 .Rはset_cppo('fast')とかを設定するとMakevarsというファイルをなかにいれてでてくる。なので.Rを消してからset_cppoを使わないでインストールすればいい。なお、自分の環境ではインストールし
このページを最初にブックマークしてみませんか?
『サボタージュ禁止のおさぼり日記』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く