SlideShare a Scribd company logo
Rで代数統計 TokyoR #42 LT
自己紹介 
•なまえ:TORUIMAI 
•ついったー:@MOTIVIC_ 
•しごと:株式会社ALBERT主任研究員 
•きょうみ:因果推論、代数統計、情報幾何、トポロジカルデータ解析 
•今週LTしたDEEPLEARNINGの性能評価が思った以上に好評だった
分割表の検定ってありますよね
例えばABテストで広告の効果があったかを検証 
商品A 
買った 
買ってない 
広告表示なし 
3 
1000 
広告表示あり 
7 
1100
カイ二乗検定で良いんでしょ?
カイ二乗検定で良いんでしょ? 
このメッセージが出なければOKってものでもない
•分割表がスパースな場合 
•行和や列和が均等でなく偏りがある場合 
には漸近分布を用いる検定は良くない 
(例えばHABERMAN(1988,JASA)など)
FISHER‘S EXACT TESTは?
FISHER‘S EXACT TESTは? 
サンプルサイズや分割表のサイズが 
大きいと計算がつらたん
漸近分布が使えずサンプルサイズが大きい場合はどうするの?
漸近分布が使えずサンプルサイズが大きい場合はどうするの? 
皆大好きMCMC!
•2元分割表であれば簡単にMCMCでP値の計算が可能 
•3元以上の分割表は? 
•“マルコフ基底”を見つけるのが難しい 
•簡単に見つける方法はないか?
代数統計 
使えばいいよ
代数統計 
使えばいいよ 
一度だけなら
色んなソフトを使って 何とか計算できた
でも次第に 
代数統計のこと 
しか考えられなく 
なります
もっと楽に 
代数統計を 
使いたい!
Rで 
代数統計を
Rで代数統計 TokyoR #42 LT
C++ 
MCMC 
マルコフ 基底
マルコフ基底 
MCMC
3元分割表での例
Rで代数統計が 
できるようになった
Rで代数統計 TokyoR #42 LT
2014/08/30アクセス 
組織の陰謀により消されました
またいつかRで 
代数統計を 
使いたい!
参考文献 
•JST CREST 日比チーム(編)(2011).グレブナー道場.共立出版. 
•S.AOKI,H.HARA,ANDA.TAKEMURA(2012).MARKOV BASES IN ALGEBRAIC STATISTICS, SPRINGER. 
•S. J.HABERMAN(1988). A WARNING ON THE USE OF CHI-SQUARED STATISTICS WITH FREQUENCY TABLES WITH SMALL EXPECTED CELL COUNTS. JOURNAL OF THEAMERICAN STATISTICAL ASSOCIATION, 83, 555–560.
代数統計とか興味あるなら 
ALBERTで一緒に働かない?

More Related Content

Viewers also liked (20)

Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージ
weda654
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前に
Kosei ABE
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
Masaki Saito
 
TokyoR42_around_chaining
TokyoR42_around_chainingTokyoR42_around_chaining
TokyoR42_around_chaining
TokorosawaYoshio
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
 
Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
Takashi Minoda
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Yohei Sato
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
Nagi Teramo
 
アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
Hidekazu Tanaka
 
はじめての「R」
はじめての「R」はじめての「R」
はじめての「R」
Masahiro Hayashi
 
Dummiesパッケージ
DummiesパッケージDummiesパッケージ
Dummiesパッケージ
weda654
 
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53thMxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
 
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
 
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
 
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリデータサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
 
R を起動するその前に
R を起動するその前にR を起動するその前に
R を起動するその前に
Kosei ABE
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
Masaki Saito
 
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
 
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Yohei Sato
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
Nagi Teramo
 
アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
Hidekazu Tanaka
 

Rで代数統計 TokyoR #42 LT