データサイエンティスト上がりのDX参謀・起業家

データサイエンティスト上がりのDX参謀・起業家のブログ。データ分析や事業について。自身はアーティスト、経営者、事業家。

Rを使えるようになるための10のこと+α

Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。
・姫路市役所での事例


これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。

※まだ不完全ですが情報を入手し次第アップデートしていきます。


1. 資料を探す場所

  • CRAN
    • R本体、パッケージ、PDF資料などの置き場
    • Task Viewに分野ごとのまとめ
    • Searchでパッケージや資料の検索
    • CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw)
  • Rjpwiki
    • 日本語で書かれている、これまでのRに関する資料の集大成
    • データの加工技、基本的な統計手法のことはほとんど載ってます
  • JapanR
    • 日本最大のRコミュニティ
    • 各地で行われているコミュニティの資料がまとめられている
  • Jin`s Page
    • あらゆる手法のアーカイブが載っています
    • 近年流行っている「Rで学ぶデータサイエンス」シリーズを書かれている先生です
  • R-tips
    • Rの使い方がわかりやすくまとまっています
  • R-bloggers
    • 世界のRエンジニアのブログ集
    • 最新のトピックが分かります


2. Rの基本的な使い方

  1. インストール
    • CRANのDownloadからダウンロードしてインストール
    • 設定は特にいじる必要なし
    • 起動するとR Consoleという画面が出るのでそこでコードを書いて実行していく
  2. 実行してみる
    • コンソールでplot(iris)と書いてエンター→何かグラフがでる
    • コンソールでlm(iris)と書いてエンター→何か線形回帰してくれる
    • コンソールでirisと書いてエンター→何かデータが表示される
    • コンソールでprcomp(iris[, -5])と書いてエンター→何か主成分分析してくれる
  3. 終了してみる
    • コンソールのバツボタンをクリック
    • 「作業スペースを保存しますか?」「いいえ」


3. Rのパッケージを使う

  • install.packages("")でインストール
  • library()で使えるようになる
  • R本体がアップデートされた場合、パッケージはインストールしなおす必要がある


4. Rの便利設定

  • 「編集→GUIプリファレンス」でいろいろ設定できる
    • windowsの場合、SDIにした方が作業しやすい(好み)


5. Rの亜種

  • RStudio
    • Rをサーバー上にインストールして利用できる
    • amazon EC2に入れて「ブラウザさえあればRが使える!」みたいにできる
  • RevolutionR
    • Rより3倍速い(らしいが自分の環境では早くならなかった)
  • Emacs ESSモード
    • EmacsでRを使う
    • 普通にRを使うよりワンテンポ遅い
    • エディタに慣れてるひとはコーディングが断然早くなる思う
  • library(Rcmdr)
    • Rã‚’GUI操作できる(ちょっと古い)
  • library(rattle)


6. Rをどうやって使う?

  1. 「ファイル→新しいスクリプト」でスクリプトを出してそこで書く
    • 行を選択して「ctl+R」で実行
  2. コンソール上でそのまま書いて実行
  3. テキストエディタでコーディング
    • コピペしてコンソールに貼付け(macはエンターが必要)
  4. Emacs ESSモード

それぞれ利点・欠点がありますのでお好みで。


7. コーディングの時の注意


8. デバッグ


9. 関数の使い方が分からないとき

  • 「?関数名」でヘルプが出る
    • ヘルプファイルには「lm {stats}」のように「関数名{パッケージ名}」と書かれている
    • Google検索などでヘルプファイルだけヒットした場合パッケージ名はこれで分かる
  • 「??文字列」でその文字が含まれている関数やパッケージが検索される


10. その他の情報

  • 他にもこれが便利!ってのかあればぜひお知らせ下さい!
  • Rはオープンソースソフトです。ユーザーの皆さんでRを育てていきましょう!


11. パッケージの作り方

  • 「10分で分かるRパッケージの作り方」
    • R CMD build hogehoge
      • 私はmacでやっています。winだとエラー。
    • R CMD check hogehoge
    • ftp://cran.r-project.org/incomingにアップロード(FTPのツールを使う)
      • macだとhttp://panic.com/jp/transmit/が便利。サーバーにcran.r-project.orgを入力、ユーザー名は空白。あとはtar.gzã‚’incomingフォルダに移動させるだけ。
    • [email protected]に連絡する