渋谷駅前で働くデータサイエンティストのブログ

元祖「六本木で働くデータサイエンティスト」です / 道玄坂→銀座→東京→六本木→渋谷駅前

初めてこのブログに来た方へ


これは初めてこのブログに来た方々向けのトップ固定記事です。最新記事の更新状況に応じて随時更新されます。

はじめに


公式のプロフィールはLinkedInに掲載しております。


このブログの内容は個人の意見・見解の表明であり、所属組織の意見・見解を代表しません。またブログ記事の内容の正確性については一切保証いたしません。学術的・技術的コンテンツを求めて来訪された方は、必ず学術書や論文などのオーソライズされた資料を併せてご参照ください。むしろ僕自身の学習のプロセスを記録しているだけの備忘録的記事が多いため、誤りもまた多いはずです。後学のため、誤りを見つけた場合はコメント欄などでお知らせいただけると有難いです。


また、ブログの中で取り上げられているデータ分析事例・データセット・分析上の知見など全ての記述は、いずれも特別に明記されていない限りはいかなる実在する企業・組織・機関の、いかなる個別の事例とも無関係です。ブログ記事内容は予告なく公開後に改変されることがあります。改変した事実は明示されることもあれば明示されないこともあります。


このブログはあくまでも僕自身にとっての備忘録であり、利便を考えてweb上に公開しているだけという位置付けのものです。中にはその見かけとは全く別の真の目的をもって書かれた記事もあります。以上の点をご理解の上、お読み下さると有難いです。

id:TJOとは何者なのか


データサイエンティスト・機械学習(人工知能)エンジニアとは何か

データ分析を仕事にしたければ読むべき本は何か

続きを読む

2025年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたい定番の書籍リスト

気付いたらこの企画をやるようになってもう12年も経つわけですが、今年も懲りずに推薦書籍リストを書いてみようかと思います。


昨年との差異ですが、まず「ホットトピックス」枠を削りました。理由は単純で、データサイエンス分野も昨今の多種多様な分野に細分化されていく一方で、「誰もが追いかけるテーマ」が事実上空前の大ブーム下にある生成AIだけになってしまっているからです。このブログのスタンスとしては「生成AIにまつわる最先端のあれこれは他所様に任せる」という方針なので、生成AIのトレンドを取り上げないとなると必然的にホットトピックスもなくなるということで、今回は定番の書籍リストのみ若干の改訂を加えて記すこととします。


一方で、生成AIが普及してきたこともあって「定番」の書籍リストにも相応の入れ替わりがあります。これまた理由はシンプルで、「この程度の実装やコーディングなら生成AIに聞けば十分」というケースが増えてきたからです(詳細は後述)。そのため、「理論やアルゴリズムの解説はそこそこにコード実装の解説が充実している」系のテキストは今年のリストからは割愛し、「しっかり理論やアルゴリズムを解説している」系のテキストをリストに新たに入れたり戻したりしています。

続きを読む

MMMのはなし

広告・マーケティング分析におけるMMM (Media/Marketing Mix Models)と言えば、このブログでも過去に何度か手を替え品を替え取り上げてきたテーマです。これまでは個々の技術的側面に着目した断片的な内容の記事を多く上げてきましたが、近年明らかにその注目度が高まってきておりますので、満を持して包括的に議論する記事を書いてみようかと思います。


ただ、記事中でも指摘しているようにMMMとはどちらかというとscienceというよりpoliticsに近い性質を持つ分析手法です。よってこの記事の内容もまたpoliticalな要素を含むものであり、是非読者の皆様からの忌憚のない指摘や批判をいただければと思います。

続きを読む

多重共線性のはなし

どうも昨年末にあちこちで多重共線性についての議論がなされていたようなんですが、些事にかまけていた僕はすっかりそのウェーブに乗り損ねてしまっていたのでした。そこで、今年最初の記事では遅ればせながらそのウェーブに乗る形で、また今までに学んだり調べてきたりしてきたことの備忘録も兼ねて、多重共線性についてまとめてみようと思います。

続きを読む