と。

統計学は趣味、マーケティングは義務。

今年買った統計学の本を流し読みして消化した気になる

この記事は統計・機械学習の数理Advent Calendar21日めの記事です。

正直数理的な要素を詰める時間が全く取れず、それでもなにか記事を書かなければという使命感から、今年読んだ本の紹介をすることにしてお茶を濁そうと思います。

かねてより本は割と取捨選択をするタイプで、図書館や書店でよくよく吟味してから買うのですが、なんだかんだ統計学の書籍はノールック購入してしまうのは未だに癖として抜けません。 今回に至っては本当に今年購入したのかすら定かではありませんが、記憶と出版年から「多分今年買ったんだと思います」という積読本を選び取り、今年のうちに流し読みだけでもしておこう、という雑な記事になります。

どれも良い本です。モチベーションのある人は是非買ってみてください。

続きを読む

好きなRパッケージが`{psych}`と`{lme4}`という話

この記事はR言語 Advent Calendar15日目の記事です。

私は卒論、修論、炎上案件は全部Rで切り抜けてきてい程度にはRを触れていて、かれこれ10年はRと暮らしています。
そうしていると当然、様々なパッケージに出会うものでして、Rユーザは好きなパッケージを述べることがアイサツ代わりになるので*1、今年のアドカレはそういう話をしようかなと思います。

昨今はtidyverseやtidymodelsといったパッケージ「群」が注目されています。
これらはRの良くも悪くもカオスなデータ分析のフォーマットに一貫した思想を持ってメンテナンスされています。 逆に言うと、これら以外のパッケージは、各領域の問題・関心に応じて異なります。 何よりR言語は「統計解析に特化した言語」であるはずなので、それはそれは多様な解析手法が実装されています。ただそこそこ残念なことに「統計解析」のパッケージに関してはそこまで注目されないのが、深層学習や大規模言語モデルが注目されるアルゴリズムになっている現代のデータ分析市場における、少しさみしいところです *2。

仕事が修羅場だし、忙しくてなに書こうかなんともわからないし、どうせn番煎じで、漸近的には内容のない記事になるのですが、せっかくなので世話になったり、シンプルに好きな統計解析パッケージを2つ紹介しようかなと思いました。 数理的な話は統計・機械学習の数理Advent Calendarで書いてほしいし、何かを書きます。

*1:そんなこともない

*2:これらの発展は人類に大きく寄与するものである確信はありますし、測定できるデータの種類と量が増えたことで、 数理統計学が発展した時代の制約の一部が取り払われたことは間違いはないと思います。 これらを認めたうえで、私はこの趨勢が、個人的に、気に食わないというだけです。

続きを読む

『データ駆動型回帰分析』を読む(お気持ち理解編)

背景

調子に乗りました。

著者に反応を受けたら、そりゃやらないといかん

というわけで『計量経済学』でも有名な末石直也先生が2024年4月に出版された 『データ駆動型回帰分析』を購入してから5ヶ月、途中休職を挟んだもののだいぶぶん投げっぱなしだったので、改めて読みます。

www.nippyo.co.jp

続きを読む

【翻訳】マーケティング・ミックス・モデリングの批判的レビュー - 誇大広告から現実へ (後編)

はじめに

前編はこちら

Acknowledgements

この記事はmc51氏のブログ記事A critical review of Marketing Mix Modeling — From hype to realityを翻訳して紹介します。

記事執筆者の許可を得ています。Thank you!

凡例

  • 各種画像は元記事をそのまま引用していますが、なにせ「うわこれは翻訳しないといけない」という衝動が先で、その中身はGoogle翻訳超依存です。
    • 原文の主張を逸脱はしないように最大限考慮しながら、元記事のユーモア(あるいは皮肉)を日本側に寄せるために一部意訳をしている部分があります。
  • 原著は主張の根拠として脚注が充実していますが、便宜上インラインのリンクも代用します。具体の引用文がある場合や執筆者のコメントは脚注で表現します。
  • 前後編に分けてお届けします
    • 前編では統計学的な批判、後半は実務的な批判と結論を述べます。
続きを読む

【翻訳】マーケティング・ミックス・モデリングの批判的レビュー - 誇大広告から現実へ (前編)

はじめに

Acknowledgements

この記事はmc51氏のブログ記事A critical review of Marketing Mix Modeling — From hype to realityを翻訳して紹介します。

記事執筆者の許可を得ています。Thank you!

凡例

  • 各種画像は元記事をそのまま引用していますが、なにせ「うわこれは翻訳しないといけない」という衝動が先で、その中身はGoogle翻訳超依存です。
    • 原文の主張を逸脱はしないように最大限考慮しながら、元記事のユーモア(あるいは皮肉)を日本側に寄せるために一部意訳をしている部分があります。
  • 原著は主張の根拠として脚注が充実していますが、便宜上インラインのリンクも代用します。具体の引用文がある場合や執筆者のコメントは脚注で表現します。
  • 前後編に分けてお届けします
    • 前編では統計学的な批判、後半は実務的な批判と結論を述べます。
続きを読む

ビジネス難易度とデータ解析の複雑度は指数関数的な関係にあるので方法論だけでは生活できない

戯言

大工が鉋にどれだけこだわっていても、設計業者は良い建物が完成すればそれで良いと考えるだろう。
もちろん、道具を大事にする大工の意識に敬意を払う者もいるだろうし、反対に道具にこだわった結果成し遂げた成果を誇る大工もいるだろう。その上で、彼らの間には最適化される目的変数に違いが存在する。
似たようなアナロジーで、統計家たる私は統計手法の適切な運用を通した成果にこだわる一方で、
ビジネスマンたちは、適用の精度は据え置きでも、その結果で成すべき意思決定方針とその価値を重視する。
この違いには、優劣が存在するわけではない。ただ、報酬となる変数とその優先度の重み付けが異なるだけである。

続きを読む

RstudioでProjectを作ったらWorkspaceの設定をしろ。`setwd()`を使うな

すごく短い

前提

  • Rでデータを読み込む方法がわかる
  • ローカルのRstudioを使っている(Rstudio serverでの挙動はわからない)
  • Rプロジェクトを作っている
  • エラー文から逃げない精神力がある
続きを読む