この記事では、統計検定準1級の対象となる「オッズ」について事例を示しながら解説していきます。
オッズとは、「生起確率pと非生起確率1-pの比をとった値」です。
そして、オッズは観察研究(後向き研究)において、便利な特性を持っています。
そこで、私の学習経験を踏まえてシンプルかつ分かりやすい解説をしていきたいと思います。
オッズとは「起きる確率pと起きない確率1-pの比をとった値」
オッズとは?
観測値 | 結果B1 | 結果B2 | 合計 |
因子A1 | θ1 | 1 – θ1 | θ1 |
因子A2 | θ2 | 1 – θ2 | θ2 |
オッズとは、「起きる確率θと起きない確率1-θの比をとった値」で、次のように定義されます。
\(odds = \frac{θ}{1-θ}\)
\(odds\) オッズ
\(θ\) 生起確率
しかし、オッズ単体で用いられるケースは少なく、オッズとオッズの比(オッズ比ψ)で議論することが基本になります。
\(ψ = \frac{θ1}{1-θ1}/\frac{θ2}{1-θ2}\)
オッズは「それぞれの因子下においての効果の程度」を示し、オッズ比は「因子を変化させた場合の効果の程度」を示していると解釈できます。
具体例
具体的な例を示したいと思います。次の表は因子を2グループに分けて「コントロール」し、喫煙者と非喫煙者に分けた後、肺がんの有無を確認しました。
肺がん患者 (B1) | 健常者 (B2) | 合計 | |
喫煙グループ (A1) | 20 | 10 | 30 |
非喫煙グループ (A2) | 5 | 25 | 30 |
この表から、喫煙者におけるオッズを計算してみると、次のようになります。
A … \(20 / 10 = 2.0\)
B … \(5 / 25 = 0.20…\)
\(ψ = A / B = 10\)
Aを見ると、喫煙によって肺がん患者は健常者と比較して、2倍かかりやすいことが分かります。
Bを見ると、喫煙しない肺がん患者は健常者の0.20倍患っています。
オッズ比は10となり、「喫煙者は非喫煙者と比較して、肺がんとなるリスクが10倍ある」と解釈できます。このようにオッズを使って、因子と結果の関係を相対的に示すことができます。
しかし、これではわざわざオッズを使う理由はありません。私たちは、「喫煙」と「肺がん」の関係性を知りたいため、\(θ1 – θ2\)や\(θ1/θ2\)というように計算してしまった方が簡易的かつ直感的に理解しやすいです。
オッズは「希少な事象のリスクを計算できる」
オッズの大きな特徴は、前向き研究と後ろ向き研究のオッズ比が等しいことです。この性質により、肺がんといった希少な事象をわざわざコントロールせず、過去の観測データから生起確率の度合いを分析することができます。
前向き研究とは、研究者自身が実験対象に対して処置を施すことができる研究のことです。要因を変えながら結果の変化を見ることができるため、因果関係をしっかりとらえられる反面、コストがかかりやすい問題があります。
後向き研究とは、研究者自身が実験対象に対して処置を施すことが難しく、対象の観察による方法でデータを得る研究のことです。コストが低い半面、結果から要因をみるという「後向き」に分析するため、因果関係がとらえにくい問題があります。
この二つの研究はオッズ比が等しいため、後向き研究のオッズから前向き研究のθ1、θ2の相対的な度合いを分析できます。
つまり、前向き研究によるコスト及び倫理的問題を後向き研究によるオッズ比の推測によって解決することができます。
具体例2
具体的な例として次の表に、肺がん患者と健常者に対して、喫煙歴の有無を確認したデータをまとめました。先ほどとは異なり「逆向き」の研究方向であるため、喫煙と肺がんの因果関係を適切に考察できません。
肺がん患者 | 健常者 | |
喫煙歴 有 | μ1 | μ2 |
喫煙歴 無 | 1 – μ2 | 1 – μ2 |
合計 | 1 | 1 |
この場合のオッズ比は次のように計算できます。
\(ψ = \frac{θ1}{1-θ1}/\frac{θ2}{1-θ2} = \frac{μ1}{1-μ1}/\frac{μ2}{1-μ2}\)
計算自体は行方向の計算を列方向に変換しただけです。このようにして、後向き研究から前向き研究のオッズ比を推定することができます。
結論
このように、オッズは生起確率がもともと低い事象についても後ろ向き研究を通じて、前向き研究のオッズ比を推定できる優れた特性を持っています。
今回は医療を例に挙げて解説していきました。そのほかにもロジスティック回帰分析やロボットに対数オッズという形で用いられることが多いようです。
まだまだ私の知らないところばかりですが、学習を進めて情報発信に努めていきたいと思います!
参考元
日本統計学会 , 統計検定準1級対応 統計学実践ワークブック
コメント