並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 8 件 / 8件

新着順 人気順

傾向スコアの検索結果1 - 8 件 / 8件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

傾向スコアに関するエントリは8件あります。 統計、 因果推論、 分析 などが関連タグです。 人気エントリには 『BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note』などがあります。
  • BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note

    電通デジタルで機械学習エンジニアをしている今井です。 本記事では、BigQueryを用いて二重頑健(doubly robust)推定量による効果検証を行うための方法について紹介します。 この記事は過去記事[1]の続編となります。 IPW推定量による効果検証 因果効果とは、仮に介入があった場合のコンバージョン値(例えば購入金額など)と、介入がなかった場合のコンバージョン値の差です。 当然ながら、同一ユーザーにおいてこれらを同時に観測することはできません。 そこで提案されたのが、実際に介入があったTreatment群のコンバージョン値の平均と介入がなかったControl群のコンバージョン値の平均の差分が因果効果である、という平均処置効果(average treatment effect, ATE)です。 しかしながら、現実には交絡因子と呼ばれる介入とコンバージョン値のいずれにも影響を与える要因

      BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note
    • Pythonで因果推論(6)~傾向スコアを用いた効果検証~

      はじめに 傾向スコアを用いた因果推論手法について、Pythonによる実装を交えてまとめました。内容について誤り等ございましたら、コメントにてご指摘いただけますと幸いです。 傾向スコア 傾向スコアとは、属性ベクトルX^iから予測される処置が施される確率(すなわち、処置を受ける傾向)のことです。 P(D^i=1|X^i) = E(D^i|X^i) = e(X^i)と表されます。効果検証にて傾向スコアを利用する際には、{Y^i_1,Y^i_0} \perp D^i | e(X^i)という条件付き独立の仮定が満たされている必要です。 傾向スコアを用いた因果推論手法はたくさんありますが、本記事では代表的な3つの因果推論手法をご紹介します。 傾向スコアマッチング 逆確率重み付け法(IPW) 二重にロバストな推定法(DR法) いずれの因果推論手法も傾向スコアを算出するところまでは同じなので、まずはデータ

        Pythonで因果推論(6)~傾向スコアを用いた効果検証~
      • 傾向スコアを用いたOverlap weighting - 統計学入門一歩先へ

        はじめに 傾向スコアを用いた解析の代表的な方法の一つとして、個人ごとの傾向スコアの推定値*1による重み付け解析があります。 重み付け解析としては、傾向スコア推定値の逆数で重み付けを行う「逆確率重み付け法(Inverse probability of treatment weighting; IPTW)」が有名で広く利用されていますが、この方法は傾向スコアの推定値に0または1に近いものがあった場合(つまり、重みが非常に大きくなる場合)に、推定のバラツキが大きくなってしまうという難点があります。そのため、例えば極端な重みの値を持つ個人を解析から除外する「トリミング(Trimming)」などの方策がこれまでにも提案されてきました。 一方で最近では、新しいタイプの重み付け手法である「Overlap weighting」が提案されています。この方法については、Liらの2018年の論文(参考資料[1]

          傾向スコアを用いたOverlap weighting - 統計学入門一歩先へ
        • 因果関係の推定 〜Pythonによる傾向スコアマッチングとIPW〜 - 見習いデータサイエンティストの隠れ家

          中学生のときに目がよく合うと感じた人がいたら、それは自分に絶大な好意を持っているからだと思い込んでいましたよね。しかし、現実は思い出のままでした。それは、「よく目が合う」ことと「好意を持つ」ことは相関しているかもしれませんが、因果の関係とまでは言えないからです。自分の隣の人をガン見していたついでに自分を見ていただけかもしれません。まさに想いの交絡です。 正常な話に戻すと、因果を見つけることは大事です。因果がわかると次に何が起きるかを間違えることなく予測できます。まさに、預言者です。相関と因果は違うというのは頭ではわかっています。しかし、相関の壁を飛び越えていける人はごく僅かです。そこで今回は、因果関係を定量的に測定する統計的因果推定をPythonを使って行います。先人の方々が同じような内容をすでに書いていますが、傾向スコアマッチングとIPWの結果が異なっているという結論が多かったので、IP

            因果関係の推定 〜Pythonによる傾向スコアマッチングとIPW〜 - 見習いデータサイエンティストの隠れ家
          • 傾向スコア・マッチング - Wikipedia

            傾向スコア・マッチング(プロペンシティ・スコア・マッチング、propensity score matching、PSM)は、観察データの統計分析の分野において、治療を受けることを予測する共変量を考慮して、処置(treatment)、方針、その他介入の効果を推定しようとするマッチング手法。処置を受けた人々と受けなかった人々の結果を単純に比較して治療効果を推定すると交絡変数によるバイアス(偏り)が発生する。このバイアスを軽減するための手法が傾向スコア・マッチングであり、1983年、ポール・ローゼンバウムとドナルド・ルービンが発表した [1]。 処置群とコントロール群(非処置群)の処置結果(平均処置効果など)の違いは、処置そのものではなく処置を予測する要因によって引き起こされる可能性があり、その場合はバイアスが発生する。ランダム化比較試験では、無作為割り付けによってバイアスなく処置効果を推定する

            • DIDと傾向スコアを用いた手法の使い分け - まずは蝋の翼から。

              なにを書くか 岩波DS vol.3(因果推論)のp.91で傾向スコアを用いて「スマホアプリ利用時間」に対する「CM接触効果」を調べるようなデータについて。本文中では、傾向スコア(Propensity Score)を用いて平均CM接触効果(ATE)を測っているが、これはCM施策前後の比較としてDID(Difference In Difference)でもできるのでは?と考えて調べました。 岩波データサイエンス Vol.3 発売日: 2016/06/10メディア: 単行本(ソフトカバー) github.com では、そもそも どういうときに傾向スコアを用いて、どういうときにDIDを使うのか? という疑問がわいたので、主に使い分けについて記載します。 なお、各手法の概要は以前書いた以下を参照。 knknkn.hatenablog.com knknkn.hatenablog.com 結論 それぞれ

                DIDと傾向スコアを用いた手法の使い分け - まずは蝋の翼から。
              • 傾向スコアを用いたIPW(IPTW)法の概要 - 医療統計学を学ぶ大学生のブログ

                先日は傾向スコアを用いたマッチングについての記事をまとめましたが、同じ傾向スコアを使う方法つながりとして、今回はIPW法についてまとめていこうと思います。 傾向スコアマッチングでは、マッチングという作業が入ってしまう分どうしても解析対象となるサンプルサイズが減少してしまうという問題がありました。これに対して後述するIPW法では、そのサイズが減らない、むしろ膨らませるという点で、変な話ですが医師の方などにはウケがいいなと個人的には感じています。 しかし、IPWには一つ重大な問題があり、詳しくは記事中でまとめますが、傾向スコアが極端に小さい値を持つ個人が推定に対して非常に大きな影響を与えてしまうというものです。まあなにはともあれ、中身を見てみないと話は進まないかなと思うのでまとめのほうに進んでいきます。 傾向スコアの復習 IPW(IPTW)推定量について IPW推定量 ATT、ATUを推定する

                  傾向スコアを用いたIPW(IPTW)法の概要 - 医療統計学を学ぶ大学生のブログ
                • サンプル数が不均衡な観察データを傾向スコアで調整できるか - Qiita

                  それぞれのデータセットは、以下の状況を想定して、データが収集されたものとします。 オリジナルのデータセットは、cm_dummy が4対6くらいで、ある程度ABテストが計画されて施策が打たれた 不均衡なデータセットは、cm_dummy が1対9で、施策のターゲットのほぼ全数に向けて施策を打った バランスの取れたデータセットは、cm_dummyが5:5で、不均衡なデータセットからサンプリングした やや処置群に偏ったデータセットは、cm_dummyが3:7で、オリジナルのデータセットから対照群のみサンプリングした やや対照群に偏ったデータセットは、cm_dummyが7:3で、オリジナルのデータセットから対照群のみサンプリングした import numpy as np import pandas as pd SEED = 42 # 1. オリジナル[6:4] df_original = pd.re

                    サンプル数が不均衡な観察データを傾向スコアで調整できるか - Qiita
                  1

                  新着記事