#7 評価法を評価する②〜検査精度の数値をどう解釈するか？〜

※この記事は前回の続き物です。前回↓

前回紹介した数値の概要をつかんだうえで理学検査をどのように解釈していくのかを理解するために、ここでは非常に有名なOttawa Ankle Rules(OAR; オタワアンクルルール)を例に考えます。

【Ottawa Ankle Rulesとは】
足関節の傷害発生時に、骨折可能性を考慮してX線による画像診断を行うべきかどうかを判断するための臨床予測ルール(clinical prediction rule)。
圧痛や歩行能力を含めた5つの臨床所見を確認し、ひとつでも引っかかったらテスト陽性と判断する(それぞれの臨床所見については教科書やWebサイトなどを見てみてください)。

OARの検査精度については次のような報告があります：

感度: 0.948 特異度: 0.423 PPV: 0.225 NPV 0.979 (Barelds et al., 2017)
感度: 0.91 特異度: 0.25 +LR: +1.47 -LR: 0.15 (Gomes et al., 2022)

ここではPPV・NPVに関してはひとまず置いておいて、感度0.9、特異度0.4の理学検査と仮定しておきましょう。このとき、両者の値から+LR=1.5、-LR=0.25となりますね。

感度と特異度の解釈：SnNOut・SpPInについて
SpPin, SnNOutだけで解釈して良いのか？
尤度比について
今回のまとめ
文献
1. 参考文献
2. 引用文献

感度と特異度の解釈：SnNOut・SpPInについて

感度と特異度に基づく解釈の最も有名な例に、”SnNOut”と”SpPIn”と呼ばれるものがあります。
これはどういうことかというと、高感度・高特異度の検査は次のような規則で解釈することが出来るというものです。

感度(Sensitivity)の高い検査で陰性(Negative)なら、疾患を除外(rule Out)出来る = SnNOut
特異度(Specificity)の高い検査で陽性(Positive)なら、疾患があると判断(rule In)出来る =SpPIn

実際は感度・特異度単一の値だけでこのように判断の基準にすることは出来ないのですが、しかしこれを覚えているだけでもある程度検査を正確に行うことが出来るとは思います。

ここで、感度とは疾患あり群で陽性になった人の割合なのになぜ陰性が重要になるのか、という点がひっかかるかもしれません。(引っかからなければ以下はスルーでOKです)

例えば感度100%の検査Aを考えたとき、これは「疾患があるのであれば、検査Aは陽性になる」ということです(感度は条件付き確率であった点を思い出してください)。
ということは、そのような検査が陽性にならないということは、その疾患がないだろうと考えることができます。

あるいは、上記をひとつの命題と考えて、その対偶を取っても良いと思います。
すなわち、「検査Aが陰性になるのであれば、その疾患はない」という命題を取ります。
ある命題が真であればその対偶も真になるので(これは高校数学の教科書に書いてあります)、ここからSnNOutを導き出すことが出来ます。

逆・裏・対偶の関係｜数学｜苦手解決Q&A｜進研ゼミ高校講座

逆・裏・対偶の関係｜数学｜苦手解決Q&Aのページです。進研ゼミ高校講座は定期テスト・大学受験の対策向けの通信教育サービスです。【ベネッセコーポレーション】

SpPInに関しても同様に考えることが出来ます。
まあ、普通に「すっぴん、すなうと」と復唱していれば覚えられることなので理屈を覚える必要があるかは微妙ですが……

SpPin, SnNOutだけで解釈して良いのか？

先の例で考えれば、OARは陰性時の骨折の除外に有効でも陽性時に骨折していると判断するには不十分な検査であるということがわかります。
というのも、OARは感度は0.9と高いものの、特異度は0.3~0.4程度とそこまで高くないためです。

しかし、検査の除外・確定能力はそれぞれ感度・特異度のみに影響されるわけではなく、それぞれ別の指標にも左右されます(Pewsner et al., 2004)。
これは、それぞれの尤度比に感度・特異度の両者が関連していることを考えればわかると思われます。

確定能力(左)と除外能力(右,尤度比の逆数を取っている点に注意！)における感度と特異度の影響を表したグラフ。
図はPewsner et al. (2004)による。

例えば、上記のOARでは感度を0.4と仮定しましたが、これが特異度0.3であるとすると、-LRは0.3に上がります。これをどう捉えるかは、尤度比をどう解釈するかという点と関連するので、次節でさらに触れます。

とはいっても、実際には疾患の除外能力・確定能力はそれぞれ感度・特異度の影響が大きいです。
なのでSpPIn/SnNOutの考え方はある程度有効ではあります。

尤度比について

オッズとは何か？

尤度比を解釈する上ではまず「オッズ」oddsの概念を理解する必要があります。
(特に今回のテーマのような統計学における)オッズとは、ひと言で言えば「確率(割合)の比」です。

例えば、A案とB案についてどちらが良いか25人のクラスで多数決を取ったとき、A案が良いと思った人が20人、B案が良いと思った人が5人いたとします。
この時、A案を選んだ人の割合は80%[割合p=0.8]、B案を選んだ人の割合は20%[p=0.2]となります。
このとき、A案の選択とB案の選択におけるオッズ比は次のようになります。

\(\begin{aligned}Odds=\dfrac{0.8}{1-0.8}=4.0\end{aligned}\)

オッズと尤度比

ここからが本節の本題です。
尤度比とは、検査陽性[陰性]者における傷害ありオッズと集団全体における傷害ありオッズの比を指します。
(以下は陽性尤度比を例にとります)

これを理解するために、陽性尤度比の算出式を次のように変形していきます(下の画像参照)

a,b,c,dの記号に関しては上述した2×2の表を参照してください。
ここでは、\(\dfrac{a}{b}\)は検査陽性者における傷害の有無の割合のオッズ比であり、(\dfrac{a+c}{b+d}\)は集団全体における傷害の有無の割合のオッズ比となる点に着目してください。

ここで、集団全体における傷害の有無のオッズ比は検査前オッズであり、検査陽性者における傷害の有無のオッズ比は検査後オッズになります。

したがって、この式はさらに

検査後オッズ = +LR × 検査前オッズ

と変形できることが分かります。
これが何を意味するかというと、検査前における傷害の見込み(事前確率)がその検査によってどの程度高まるか、ということです。

ちなみに陰性尤度比に関しても、検査後オッズ = -LR ×検査前オッズと式変形でき、これは「検査前における傷害の見込み(事前確率)がその検査によってどの程度低くなるか」を指します。

尤度比の解釈

我々トレーナーは、スペシャルテストを用いる前に、視診や問診など(いわゆるHOPSの”HOP”のプロセス)を通して「その傷害のある確率がどれくらいか」を頭の中で推定していると思います。

例えば次のようなシチュエーションを考えてみましょう。

フットボール選手が、プレー直後に足首の痛みを訴えでフィールドからアウトした。
スパイクとソックスを慎重に脱がせて患部を確認してみると、足関節周囲の明らかな変形は認められなかったが、遠位脛腓関節前面に強い炎症所見が見られる。
話を聞いてみると、受傷機転としてはボールをジャンプしてキャッチした直後に相手に当たられ、足関節の強制背屈が該当すると考えられた。
圧痛は足関節前面(内果-外果間)で特に強く、AROMは背屈で疼痛を訴える。

このように最初の問診や視診が行われたら、特にフットボールの現場にいるトレーナーであれば「んー、high ankle(=syndesomotic injury)だろうな……」と考えるかと思います。と同時に、骨折の可能性に関しても頭の中をちらつくでしょう。

ここで、high ankleだという事前の見込みが80%であるとします。骨折の可能性はここでは除外できているものと考えて、high ankleであるという見込みを高めるために検査をします。

syndesmosis sprainに対するスペシャルテストはいくつかありますが、ここではKleigerテストを一例にとります。
Kleigerテストの+LRの報告は1.32~18.00と幅広いですが(Starkey & Brown, 2015)、ここでは10.00としておきます。

ここで、どの程度検査後の見込みは高まるのかが問題になります。これを確かめるために、Faganのノモグラムというものを用います。

Starkey & Brown(2015)を基に作成。
事前確率の値を基点に、尤度比に向けて直線を引いて、その延長戦上にあるものが事後確率の値になる。

これを用いることで、事前の見込みをオッズに変換する手間が省けます。
このノモグラムから、Kleigerテストを用いることで「80%high ankleだろう」という事前の見込みが「95%以上high ankleだろう」とみなすことができるようになります。

このノモグラムからは、大きな尤度比の値は事後確率を高めて傷害の確定に役立つ一方、小さな尤度比(陰性尤度比)は事後確率を低くして除外に役立つことがわかります。

一番最初に例に出したOARを考えると、例えばスペシャルテストを行うまでのプロセスで骨折の可能性が30%はありそう……と考えた時、-LRは0.25であるので上のノモグラムに線を引いて考えればおおよそ10%程度にまでその可能性を下げることが出来るというわけです。

実際にはノモグラムを用いる必要は必ずしもないですが、しかし尤度比の値というのはこのように解釈することができます。

ちなみに陽性尤度比は無限に大きい値を取ることが出来ます。
例えば足根管症候群に対するdorsiflexion-eversion testや、足関節外側靱帯損傷に対する前方引き出しテストanterior drawer testは、+LRが∞であると報告されています(Schwieterman et al., 2013)。

今回のまとめ

今回は前回に続き、感度や特異度といった数値について、特にどのような理屈でどういう解釈をしていくのかを見ていきました。

この話が直接検査に役立つかと言われると微妙ですが、しかし理屈を知った上で検査数値を解釈するか、ただ文献に書いてある数値を丸覚えするかでは理解度も異なると思います。

ぜひ今回のような考え方が臨床で検査を行う際にそのバックグラウンドとして使えれるようになると良いと思います。

文献

参考文献

前回と同じです。

引用文献

Barelds I, Krijnen WP, van de Leur JP, van der Schans CP, Goddard RJ. Diagnostic Accuracy of Clinical Decision Rules to Exclude Fractures in Acute Ankle Injuries: Systematic Review and Meta-analysis. J Emerg Med. 2017;53(3):353-368. doi:10.1016/j.jemermed.2017.04.035
Gomes YE, Chau M, Banwell HA, Causby RS. Diagnostic accuracy of the Ottawa ankle rule to exclude fractures in acute ankle injuries in adults: a systematic review and meta-analysis. BMC Musculoskelet Disord. 2022;23(1). doi: 10.1186/s12891-022-05831-7
Schwieterman B, Haas D, Columber K, Knupp D, Cook C. Diagnostic accuracy of physical examination tests of the ankle/foot complex: a systematic review. Int J Sports Phys Ther. 2013;8(4):416-426.
Starkey C, Brown SD. Examination of orthopedic & athletic injuries. 4th ed. F.A. Davis;2015