オッズとオッズ比
P値の簡易解説。【アビガン特定臨床研究を例に】という記事でP値の紹介をしました。
この記事で紹介した『ファビピラビル(アビガン)特定臨床研究の最終報告について』の副次評価項目を確認すると
事前に規定された副次評価項目である「6日目までのウイルス量対数値50%減少割合」は通常投与群で94.4%、遅延投与群で78.8%、調整後オッズ比は4.75(95%信頼区間=0.88-25.76、P値=0.071)でした。
ファビピラビル(アビガン)特定臨床研究の最終報告について
と記載されており、オッズ比や95%信頼区間というものが登場しています。他にもハザード比等も登場しておりますので、前回の記事の補足として、それぞれ分けてご紹介させていただきます。
オッズ
まずはオッズですオッズ比ではありません。オッズです。ウィキペディアから定義を引っ張ってきました。
オッズ(英: odds)は、確率論で確率を示す数値。ギャンブルなどで見込みを示す方法として古くから使われてきた。
もともと、失敗 b 回に対して成功 a 回の割合のときに比 a/b として定義された。ある事象の起こる確率 p と起こらない確率 1 − p との比 p / (1 − p) のこと。
ある事象の起こる確率 p が 1/2 を超えることはオッズが 1 を超えることに等価であり、0 ≤ p < 1 の範囲で確率とオッズは1対1に対応し、確率とオッズは同じものの別表現になっている。確率が十分に小さいとき(例えば p < 0.1)、オッズは確率とおおよそ等しい。
オッズ Odds と確率 には以下の関係式が成り立つ。
出典: フリー百科事典『ウィキペディア(Wikipedia)』
具体例
case1:『100人の患者にAという薬を使って80名の救命に成功した。』というケースで考えてみます。これアビガンの臨床研究で同じ様なことよく言われますね。アビガンで8割回復とか、、、そんなイメージで設定してます。
この場合の救命できる確率は80人/100人で0.8つまり80%です。p=0.8です。
Odds=p/(1-p)なので0.8/(1-0.8)=4 Odds=4となります。
オッズは二者 を比べて, どちらが多いか示す指標です。
この場合の4という数字は救命者が死亡者より4倍多いことを示します。
オッズ比
オッズ比はその名の通り、オッズの比です。
オッズ比はある事象の、1つの群ともう1つの群とにおけるオッズの比として定義される。事象の両群における確率を p(第1群)、q(第2群)とすれば、オッズ比は
出典: フリー百科事典『ウィキペディア(Wikipedia)』
『Bという病気、100人の患者にAという薬を使って80名の救命に成功した。』オッズ4
というcase1と比較してAという薬の効果を調べるためにもう一つ別のケースを用意します。
今回はcase2:『Bという病気に100人にCという薬を使って70名の救命に成功した』というケースを用意して考えてみます。同じ病気の100人に別の薬を使った訳です。
この場合は確率p=0.7 Odds=0.7/(1-0.7)=0.7/0.3=2.33…となります。
救命された人の数が2.3倍多いという結果です。オッズ2.33…です。
プラセボないし明確に有効な薬との比較が必要
ここまでの小括をすると
- case1:『Bという病気、100人の患者にAという薬を使って80名の救命に成功した。』オッズ4
- case2:『Bという病気に100人にCという薬を使って70名の救命に成功した』オッズ2.33
- オッズ比:AとCのオッズ比は1.71。
という結果がえられました。前述の通り、C薬に明確な有効性が認められていない場合、この結果からは『Bという病気にはAの方がCより良い』という結果しか示しません。これは=有効ではありません。
これを説明するために以下ケースを加えます。
case3:『Bという病気100人にプラセボを飲ませた場合、75名の救命に成功した』
この場合のオッズは3です。あれ?って思いませんか?
Cとプラセボのオッズ比は2.33/3=0.7766…となります。プラセボと比較したオッズ比が1より小さいのでこの場合はプラセボより悪いということです。
同様にA薬とプラセボのオッズ比を計算すると4/3=1.333となりますのでA薬は有効という結論で問題ありません。
補足、95%信頼区間について
オッズ比は1を超えていれば優れている、下回れば劣っていると判断します
ここで重要なのは仮にオッズ比が3だった時に3倍優れているとしてはいけません。これダメダメなやつだったりします。
オッズ比は有効無効の判断と複数のオッズ比があった時にその優劣がわかるだけなんです。効果の強弱はリスク比で測ります。
感覚的にはリスク比の方がわかりやすいですし、何倍という比較もできますが、オッズ比の方が汎用性が高いのと絶対的な確率が小さくなればリスク比と近似するためよく使われます。
さらに臨床試験におけるオッズ比は推定値でしかありません。そのため95%信頼区間も重要な指標だったりします。
オッズ比は推定値であるため、真の値は大体その辺りにあることだけが予想されます。ほぼほぼ間違いなさそうですが、95%信頼区間と組み合わせることでさらに正確に判断できます。
95%の確率で真の値が存在する範囲を示しているのが95%信頼区間です。その下限値が1を超えていれば95%の確率でオッズ比が1を超える訳なので、恐らく有効なのは間違いないと判断されます。つまり下限が1を超えていないと有意とは言えません。
再確認ですが、アビガンの特定臨床研究で一番惜しかった副次評価項目ををみますと
事前に規定された副次評価項目である「6日目までのウイルス量対数値50%減少割合」は通常投与群で94.4%、遅延投与群で78.8%、調整後オッズ比は4.75(95%信頼区間=0.88-25.76、P値=0.071)でした。
ファビピラビル(アビガン)特定臨床研究の最終報告について
P値は0.07、95%信頼区間も下限が1を下回っており、全く統計的に有意差を出せていないことがわかります。
余談とあとがき
少々私的意見を挟みますが、世間に存在するアビガン絶対信者の皆様の主張は
- 特定臨床研究は症例数が少ない。統計的に負けて当然
- 9割効いたというデータが出ている
- 有名な科学者が有効性を謳っている
というものが多い様に感じます。
一つ目は帰無仮説に基づく臨床試験で有意差を出せなかった時点で無効と評価することが正しいです。後出しで症例数が少なかったというのはナンセンスです。それどころか、主要、副次、探索全て負けてますから惨敗もいいところです。
二つ目は今回の記事を読んでいただいた方には理解できるでしょうが、プラセボや有効性が証明されたレムデシビルとの比較で有意差を出せなければ意味がありません。同一条件でプラセボで91%回復とかの結果だとオッズ比は1を下回り毒になります。比較試験が重要な理由ですね。
三つ目はエビデンスなき権威の言葉は一般人より参考になるレベルです。エビデンスレベルは最も低くなります。無銘の研究者が観察研究で効果反対したデータの方が指示されます。薬効判定に個人の権威は関係ないです。権威ある先生の使用経験で薬を承認し薬害事件に発展した過去もあります。
かなりアビガンのデータは厳しい状況です。使い方を工夫すれば有意差を出すこともできるかもしれませんが、特効薬と持ち上げるほどではないでしょう。
やっぱり、臨床試験の結果をしっかりみれていない…というより臨床試験の結果がわかりにくい点が大きな問題なんでしょうか。当記事でオッズ比に関して少しでも理解をえられましたら幸いです。