Submit Search
TokyoR42_around_chaining
Aug 30, 2014
10 likes
19,018 views
T
TokorosawaYoshio
TokyoR#42
Read less
Read more
1 of 34
Download now
Downloaded 16 times
Recommended
dplyrとは何だったのか
dplyrとは何だったのか
yutannihilation
Tokyo.RでのLTのスライド.。dplyについてのポエムです。
協調フィルタリング with Mahout
協調フィルタリング with Mahout
Katsuhiro Takata
協調フィルタ
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
Yasuyuki Sugai
2013年11月期 AITCオープンラボ R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機会学習・データビジュアライゼーション事始め〜
Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
Akifumi Eguchi
JapanR 2016でのLT資料です
機械学習チュートリアル@Jubatus Casual Talks
機械学習チュートリアル@Jubatus Casual Talks
Yuya Unno
TensorFlowとは? ディープラーニング (深層学習) とは?
TensorFlowとは? ディープラーニング (深層学習) とは?
KSK Analytics Inc.
ディープラーニング(深層学習)のソフトウェア「TensorFlow」の紹介と従来の機械学習との違いを解説
統計学勉強会#2
統計学勉強会#2
Hidehisa Arai
A presentation for meeting of statistics in Japan. https://connpass.com/event/204931/ Topics: Methods and their properties to measure dependencies between variables
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/30518257
統計用言語Rの使い方
統計用言語Rの使い方
Ak Ok
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
ARG 第7回Webインテリジェンスとインタラクション研究会 企画セッション2「不揃いなデータ達の分析を行う前のTips」
機械学習
機械学習
Hikaru Takemura
某研究室のM1が,B4向けに機械学習の講義を行った際のスライドです.
Rstudio事始め
Rstudio事始め
Takashi Yamane
改訂版(2015.11.28)ができました → http://www.slideshare.net/TakashiYamane1/rrstudio
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Yuya Unno
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
現在は機械学習ライブラリが充実しており、また、教師データの獲得も容易になっています。 そのため、機械学習のビジネス利用への敷居が下がっています。 予測や分類といった問題を解く際には、設定した課題に対してどのモデルが最も適しているかを評価するための指標(評価関数)が必要になります。 Kaggle(([有名なデータサイエンスのコンペティション](https://www.kaggle.com)))などでは評価指標が定まっていますが、実ビジネスで機械学習を応用する際には自ら評価指標を設定する必要があります。 しかし、適切な評価関数を選ぶのは初学者には難しく、またビジネスの問題設定、目的意識によっても異なります。 さらに、オフラインでの予測はユーザの実際の行動予測とはギャップがある 場合もあります。 [1] Data-Driven Metric Development for Online Controlled Experiments: Seven Lessons Learned Xiaolin Shi*, Yahoo Labs; Alex Deng, Microsoft; KDD '16 [2] 情報検索の基礎 Christopher D.Manning (著), Prabhakar Raghavan (著), Hinrich Schutze (著) 岩野 和生ら (翻訳), 共立出版 2012 [3] kaggle: https://www.kaggle.com/ そこで、多くある評価関数のうち代表的なものを幾つかをまとめました。
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
IEICEソサエティ大会2013 "知的環境を実現するビッグデータ解析と通信行動分析"セッションでの講演内容です。
初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2
OWL.learn
6月4日(木)に開催した「初心者のためのRとRStudio入門 vol.2」の講義資料です。 今後もデータサイエンスに関する勉強会を開催するので、お気軽にご参加ください! http://owl-learn.connpass.com/
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Python 機械学習プログラミング データ分析演習編
Python 機械学習プログラミング データ分析演習編
Etsuji Nakai
この資料では、Pythonのデータ分析ライブラリーである「pandas」を使う練習を目的として、データ分析の初歩的な内容を解説しています。 2015/11/25 ver1.0 公開 2015/12/11 ver1.1 仮説検定の説明を分かりやすく修正 2016/11/15 ver2.0 改訂版公開、scikit-learnの利用例を追加 2017/06/11 ver2.1 仮説検定パートを削除、sklearnの利用例をアップデート
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
エンジニアサポートCROSS2014 機械学習CROSSセッション前半資料です
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
データ解析入門〜グラフ分析処理・スクレイピング〜【found IT projectセミナー#6】 https://foundit-project.connpass.com/event/51809/
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
2012/11/19 情報処理学会連続セミナー「ビッグデータとスマートな社会」の第5回:ビッグデータに立ち向かう機械学習での講演資料です。
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
Tatuya Kobayashi
IoTが盛り上がる中、初心者の方には、データを取得してからそのデータをどうするのか 悩まれている人が多いと思います。 その取得したデータを解析するpandas、jupyter、matplotlib、StatsModelsを紹介し、生データを可視化します
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
福岡市内のイベントで発表した資料です。
tokyo_webmining_no51
tokyo_webmining_no51
Shu (shoe116)
データサイエンティストの憂鬱と、そこから思いついて実行したデータマートプロジェクトの話。詳細は↓ http://shoe116.hatenablog.com/entry/2016/04/04/084113
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
TensorFlow初心者の開発者が、TensorFlowに期待することを発表します。
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
__nakamichi__
R6パッケージの紹介―機能と実装
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Shuyo Nakatani
Tokyo.R #57 の発表資料です。
More Related Content
What's hot
(20)
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
2013/03/28 PFIセミナー「(道具としての)データサイエンティストのつかい方」資料 Ustreamの録画はこちらです→ http://www.ustream.tv/recorded/30518257
統計用言語Rの使い方
統計用言語Rの使い方
Ak Ok
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
ARG 第7回Webインテリジェンスとインタラクション研究会 企画セッション2「不揃いなデータ達の分析を行う前のTips」
機械学習
機械学習
Hikaru Takemura
某研究室のM1が,B4向けに機械学習の講義を行った際のスライドです.
Rstudio事始め
Rstudio事始め
Takashi Yamane
改訂版(2015.11.28)ができました → http://www.slideshare.net/TakashiYamane1/rrstudio
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Yuya Unno
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
現在は機械学習ライブラリが充実しており、また、教師データの獲得も容易になっています。 そのため、機械学習のビジネス利用への敷居が下がっています。 予測や分類といった問題を解く際には、設定した課題に対してどのモデルが最も適しているかを評価するための指標(評価関数)が必要になります。 Kaggle(([有名なデータサイエンスのコンペティション](https://www.kaggle.com)))などでは評価指標が定まっていますが、実ビジネスで機械学習を応用する際には自ら評価指標を設定する必要があります。 しかし、適切な評価関数を選ぶのは初学者には難しく、またビジネスの問題設定、目的意識によっても異なります。 さらに、オフラインでの予測はユーザの実際の行動予測とはギャップがある 場合もあります。 [1] Data-Driven Metric Development for Online Controlled Experiments: Seven Lessons Learned Xiaolin Shi*, Yahoo Labs; Alex Deng, Microsoft; KDD '16 [2] 情報検索の基礎 Christopher D.Manning (著), Prabhakar Raghavan (著), Hinrich Schutze (著) 岩野 和生ら (翻訳), 共立出版 2012 [3] kaggle: https://www.kaggle.com/ そこで、多くある評価関数のうち代表的なものを幾つかをまとめました。
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。本講演ではその動作原理を中心にJubatusの裏側を紹介する。
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
IEICEソサエティ大会2013 "知的環境を実現するビッグデータ解析と通信行動分析"セッションでの講演内容です。
初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2
OWL.learn
6月4日(木)に開催した「初心者のためのRとRStudio入門 vol.2」の講義資料です。 今後もデータサイエンスに関する勉強会を開催するので、お気軽にご参加ください! http://owl-learn.connpass.com/
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Python 機械学習プログラミング データ分析演習編
Python 機械学習プログラミング データ分析演習編
Etsuji Nakai
この資料では、Pythonのデータ分析ライブラリーである「pandas」を使う練習を目的として、データ分析の初歩的な内容を解説しています。 2015/11/25 ver1.0 公開 2015/12/11 ver1.1 仮説検定の説明を分かりやすく修正 2016/11/15 ver2.0 改訂版公開、scikit-learnの利用例を追加 2017/06/11 ver2.1 仮説検定パートを削除、sklearnの利用例をアップデート
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
エンジニアサポートCROSS2014 機械学習CROSSセッション前半資料です
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
データ解析入門〜グラフ分析処理・スクレイピング〜【found IT projectセミナー#6】 https://foundit-project.connpass.com/event/51809/
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
2012/11/19 情報処理学会連続セミナー「ビッグデータとスマートな社会」の第5回:ビッグデータに立ち向かう機械学習での講演資料です。
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
Tatuya Kobayashi
IoTが盛り上がる中、初心者の方には、データを取得してからそのデータをどうするのか 悩まれている人が多いと思います。 その取得したデータを解析するpandas、jupyter、matplotlib、StatsModelsを紹介し、生データを可視化します
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
福岡市内のイベントで発表した資料です。
tokyo_webmining_no51
tokyo_webmining_no51
Shu (shoe116)
データサイエンティストの憂鬱と、そこから思いついて実行したデータマートプロジェクトの話。詳細は↓ http://shoe116.hatenablog.com/entry/2016/04/04/084113
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
TensorFlow初心者の開発者が、TensorFlowに期待することを発表します。
(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
Shohei Hido
統計用言語Rの使い方
統計用言語Rの使い方
Ak Ok
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
WI2研究会(公開用) “データ分析でよく使う前処理の整理と対処”
Hajime Sasaki
機械学習
機械学習
Hikaru Takemura
Rstudio事始め
Rstudio事始め
Takashi Yamane
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
Yuya Unno
Jubatusにおける機械学習のテスト@MLCT
Jubatusにおける機械学習のテスト@MLCT
Yuya Unno
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
圭輔 大曽根
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Jubatus: 分散協調をキーとした大規模リアルタイム機械学習プラットフォーム
Preferred Networks
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
Shohei Hido
初心者のためのRとRStudio入門 vol.2
初心者のためのRとRStudio入門 vol.2
OWL.learn
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Twitter分析のためのリアルタイム分析基盤@第4回Twitter研究会
Yuya Unno
Python 機械学習プログラミング データ分析演習編
Python 機械学習プログラミング データ分析演習編
Etsuji Nakai
機械学習CROSS 前半資料
機械学習CROSS 前半資料
Shohei Hido
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
bigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
Pythonで時系列のデータを分析してみよう
Pythonで時系列のデータを分析してみよう
Tatuya Kobayashi
ディープラーニングで株価予測をやってみた
ディープラーニングで株価予測をやってみた
卓也 安東
tokyo_webmining_no51
tokyo_webmining_no51
Shu (shoe116)
開発者からみたTensor flow
開発者からみたTensor flow
Hideo Kinami
Viewers also liked
(20)
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
__nakamichi__
R6パッケージの紹介―機能と実装
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Shuyo Nakatani
Tokyo.R #57 の発表資料です。
Dummiesパッケージ
Dummiesパッケージ
weda654
Tokyo.Rの42回にて、かんたんにダミー変数がつくれるパッケージを試してみた
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
R入門(dplyrでデータ加工)-TokyoR42
Rcppのすすめ
Rcppのすすめ
Masaki Tsuda
Rの関数をC++で記述することを可能にするパッケージRcppの使い方の紹介です。 第10回 Kashiwa.R で発表させて頂いた時の資料
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Toru Imai
20150303ぞくパタLT - Bayes LiNGAMのはなし
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
第53回 Tokyo.R LT資料です。
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
Rで潜在ランク分析を実行する関数を作りました
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
第52回R勉強会@東京 飛び入り発表資料
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
Takashi Kitano
Tokyo.R#65 初心者セッション
R を起動するその前に
R を起動するその前に
Kosei ABE
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
データサイエンティスト必見! M-1グランプリ 前処理の頂点は誰だ!? 出場者はRのdplyr、PostgreSQL、NYSOLのMコマンドなど。
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
※ここで解説しているお天気推移モデルはオリジナルなものですので、数値・計算等にミスがある可能性が否めませんので、もし間違いを見かけた方は優しく教えていただけると助かります。 お天気推移モデルで理解するマルコフ連鎖モンテカルロ法。2状態離散モデルの解説を中心に、メトロポリス法の解説まで行った。 次は連続モデルや熱浴法・メトロポリスヘイスティング法の解説資料も作成したい⇒完成。以下のLINKを参照下さい。http://www.slideshare.net/teramonagi/ss-5344006 誤字を修正(2010/11/01)
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
Toru Imai
Rで代数統計 TokyoR #42 LT algstat 2014/08/30
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
ハードディスクのデータセットに対するデータ解析
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
最新版はこちら: https://speakerdeck.com/yutannihilation/ggplot2zai-ru-men
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
Point of view when analyzing
Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
Tokyo r33 beginner
Tokyo r33 beginner
Takashi Minoda
Tokyo r30 anova
Tokyo r30 anova
Takashi Minoda
Rによる分散分析
R6パッケージの紹介―機能と実装
R6パッケージの紹介―機能と実装
__nakamichi__
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
Shuyo Nakatani
Dummiesパッケージ
Dummiesパッケージ
weda654
R入門(dplyrでデータ加工)-TokyoR42
R入門(dplyrでデータ加工)-TokyoR42
Atsushi Hayakawa
Rcppのすすめ
Rcppのすすめ
Masaki Tsuda
20150303ぞくパタLT-ゆるふわ構造学習
20150303ぞくパタLT-ゆるふわ構造学習
Toru Imai
Mxnetで回帰 #TokyoR 53th
Mxnetで回帰 #TokyoR 53th
Akifumi Eguchi
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
20140625 rでのデータ分析(仮) for_tokyor
20140625 rでのデータ分析(仮) for_tokyor
Takashi Kitano
20170923 excelユーザーのためのr入門
20170923 excelユーザーのためのr入門
Takashi Kitano
R を起動するその前に
R を起動するその前に
Kosei ABE
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
マルコフ連鎖モンテカルロ法入門-1
マルコフ連鎖モンテカルロ法入門-1
Nagi Teramo
Rで代数統計 TokyoR #42 LT
Rで代数統計 TokyoR #42 LT
Toru Imai
最強のハードディスクはどれだ?
最強のハードディスクはどれだ?
Atsushi Hayakawa
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
Yohei Sato
Tokyor42 ggplot2
Tokyor42 ggplot2
Yohei Sato
Tokyo r33 beginner
Tokyo r33 beginner
Takashi Minoda
Tokyo r30 anova
Tokyo r30 anova
Takashi Minoda
Similar to TokyoR42_around_chaining
(9)
ネットワーク運用とIoT
ネットワーク運用とIoT
cloretsblack
Network operation with IoT
PySpark を分析用途に使っている話
PySpark を分析用途に使っている話
LINE Corporation
LINE株式会社 DataLabs 丸尾大貴 PyData.Tokyo Meetup #17 - データ分析の現場 での発表資料です。 https://pydatatokyo.connpass.com/event/77008/
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
2015/05/31 Bizreach✕Cookpad✕Gunosy✕UserLocal 分析プラットホームとその技術で発表した内容です
tut_pfi_2012
tut_pfi_2012
Preferred Networks
豊橋技科大で2012/6/12で特別講義で利用した資料です。講義時の資料とは多少異なっています。
Rブートキャンプ
Rブートキャンプ
Kosuke Sato
2020.7.25に島根大学人間科学部で行ったRの基礎講座です。 Rでテキストマイニング講義(https://github.com/satocos135/lecture2020shimane)を行うにあたり最低限必要な知識群を詰め込んでいます。 補足資料として作った、各項目の知識を確認するためにエクササイズもGitHubに置いてあります。
今日から業務で使える17の運用系Linuxツール、そして円環の理
今日から業務で使える17の運用系Linuxツール、そして円環の理
Masahito Zembutsu
運用系ツールのつもりが、新人さんに伝えたい「円環の理」資料になってしまいました。 “qpstudy 2013.04”の @zembutsu LT 発表資料です 『qpstudy3周年記念LT大会 〜新人さん、業界にようこそ!〜 with ビール』 http://www.zusaar.com/event/613004 共有したかった事 ・2013年、這い寄る混沌・ガラケーは衰退しました ・基本コマンドの連携は必須 ・時系列リソース監視が鍵 ・仲間達と協力する心も大切
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
The Japan DataScientist Society
一般社団法人データサイエンティスト協会「2ndシンポジウム」でのスキル委員会による講演資料です。詳細は、データサイエンティスト協会公式サイトをご覧ください。URL:http://www.datascientist.or.jp/
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
第46回東京R勉強会 #TokyoRの資料です。
データプランナーによるデータ系施策について
データプランナーによるデータ系施策について
Recruit Lifestyle Co., Ltd.
・データプランナーとは ・データプランナーによるデータ系施策 ・エンジニからデータプランナーになってみて リクルートライフスタイル テクノロジープラットフォームU 本庄智也
ネットワーク運用とIoT
ネットワーク運用とIoT
cloretsblack
PySpark を分析用途に使っている話
PySpark を分析用途に使っている話
LINE Corporation
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
20150531分析プラットホームとその技術(bizreach) cookpad ito #dcube_analysis
tetsuro ito
tut_pfi_2012
tut_pfi_2012
Preferred Networks
Rブートキャンプ
Rブートキャンプ
Kosuke Sato
今日から業務で使える17の運用系Linuxツール、そして円環の理
今日から業務で使える17の運用系Linuxツール、そして円環の理
Masahito Zembutsu
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
The Japan DataScientist Society
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
データプランナーによるデータ系施策について
データプランナーによるデータ系施策について
Recruit Lifestyle Co., Ltd.
More from TokorosawaYoshio
(10)
R45LT
R45LT
TokorosawaYoshio
No SINCHOKU, No Life
JapanR2014
JapanR2014
TokorosawaYoshio
JapanR2014
Tokyor37
Tokyor37
TokorosawaYoshio
Tokyor44
Tokyor44
TokorosawaYoshio
TokyoR44LT
データ解析のための勉強会第7章
データ解析のための勉強会第7章
TokorosawaYoshio
Rから通知をとばす
Rから通知をとばす
TokorosawaYoshio
TokyoR #41 LTより。 Rから通知をとばすパッケージ及び愚痴です。
2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする
TokorosawaYoshio
TokyoR38初心者セッションより
TokyoR40
TokyoR40
TokorosawaYoshio
Compare R and Julia
Tokyor36
Tokyor36
TokorosawaYoshio
dplyr intro
TokyoR#31 初心者セッション
TokyoR#31 初心者セッション
TokorosawaYoshio
TokyoR#31 初心者セッション
R45LT
R45LT
TokorosawaYoshio
JapanR2014
JapanR2014
TokorosawaYoshio
Tokyor37
Tokyor37
TokorosawaYoshio
Tokyor44
Tokyor44
TokorosawaYoshio
データ解析のための勉強会第7章
データ解析のための勉強会第7章
TokorosawaYoshio
Rから通知をとばす
Rから通知をとばす
TokorosawaYoshio
2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする
TokorosawaYoshio
TokyoR40
TokyoR40
TokorosawaYoshio
Tokyor36
Tokyor36
TokorosawaYoshio
TokyoR#31 初心者セッション
TokyoR#31 初心者セッション
TokorosawaYoshio
TokyoR42_around_chaining
1.
%%%%%%%%%% %%%%%%%%%% %%%%%%%%%%
%%%%%%%%%% %%%%所沢義男%
2.
最近の所沢情報 • 「データ解析のための統計モデリング入
門」読書会で発表しました – 第7章一般化線形混合モデル • 最近はレビュー職人になりました – 以下の2冊レビューさせていただきました – 「ドキュメント・プレゼンテーション生成」 – 「戦略的データマイニング」 – R本の出版前のレビュー随時受け付けており ます
3.
本日のまとめ • dplyrという便利パッケージがあります
• magrittrという便利パッケージがあります • renkun(通称クオンツ蓮君)を応援しま しょう
4.
dplyr、ご存じですか
8.
里洋平 著「戦略的データマイニング」より
9.
そんなわけで今回は 実務で役立つ dplyrのユースケースについて
ご紹介します!!!
10.
なんてことはしない
11.
そんな有益な話は ググればいくらでも出てくる
12.
ということで今日は 皆さんの人数×20分という 貴重な時間を使って
%%%%%%%%%%%%%%%%% %%%%%%%%%%%%界隈の話 をします!!!
13.
まずは基礎知識 • Rでは%%で挟むことで演算子を定義
できる • 組み込みだと%in% • Hmiscの%nin%も有名 %
14.
それで俺俺演算子を 作った男がいた その名は
Hadley Wickham
15.
そう、ggplot2の作者ですよ
16.
作ったのは%.% • chain演算子
• thenと読むらしい • Unixとか他の言語でいうところのpipeとか メソッドチェーンとか – Unixだと| – F#だと |> – juliaも|> – jQueryだと. %.%
17.
こんな風につかう tbl <-
group_by(iris, Species) summarise_each(tbl, funs(mean), matches("Sepal")) l 一時オブジェクトを作る必要なし l 処理が左から右に流れていくので 書いてて気持ちが良い iris %.% group_by(Species) %.% summarise_each(funs(mean), matches("Sepal"))
18.
でも%.%は%>%に
19.
magrittrパッケージ • %.%はもっとできのいい%>%を別パッケー
ジからインポートすることで置き換えら れた • magrittrパッケージは%>%以外にもchain 関連の演算子を用意している %>%
20.
chainするならmagrittr • chain関連の演算子を色々と含む
• %>%とか%T>%とか:= とか • chainするときのエイリアスも用意 – [ → extract – + → add – & → and などなど
21.
%>% • 左から右に処理をつないでいく
• デフォルトでは最初の引数に渡される • 他の引数に渡したい時は . (ドット)を使う
22.
%T>% • 副作用を利用したいときに使う
• 処理の途中でプロットしつつ、最後にオ ブジェクトに保存する、とか こんな感じ iris %>% group_by(Species) %>% summarise(avg=mean(Sepal.Length)) %T>% plot(.) -> res
23.
:= • 以下のように処理したオブジェクトを元の
オブジェクトに再代入するときに使う これが iris <- iris %>% group_by(Species) %>% mutate(all=n()) こうなる iris := group_by(Species) %>% mutate(all=n())
24.
覚えましたか
26.
そんなdplyrとmagrittrの 蜜月関係に 一石を投じるものが
27.
クオンツ蓮君 • 中国のクオンツ
• pipeRというパッケージで%%%業界に 一石を投じる • rlistパッケージというリスト操作パッケー ジも開発→こちらは便利 • サイトは http://renkun.me
28.
クオンツ蓮君の一石 pipeR •
演算子は%>>%のみ – これ1つでmagrittrの大体の機能をまかなえる • %>%の3倍以上速い • しかもPipeで囲うことで$でchainできる Pipe(iris) $group_by(Species)$tally()
29.
しかし分が悪い • %>>%はタイプが面倒
• %>%は最新版のRStudioの場合、 Alt+Shift+. というショートカットがある • Rbloggersとか見てる限り蓮君なんだかグ ローバルに無視されてる気がする – 速いのに – それなりに便利なのに
30.
Rグローバルリア充軍団 (※個人の感想です) vs
クオンツ蓮君
31.
高くて硬い壁と、 壁にぶつかって割れてしまう卵が あるときには、
私は卵の側に立ちたい
32.
皆さんも盲目的に magrittrに走るのではなく pipeRもその検討の俎上に
挙げてほしい
33.
ということで最後にまとめ • dplyrという便利パッケージがあります
• magrittrという便利パッケージがあります • renkun(通称クオンツ蓮君)を応援しま しょう
34.
enjoy!