【EBM】如何解讀隨機分派研究RCT的結果 @ 微笑藥師網

通常利用實證醫學技巧找尋到相關研究時，總是迫不急待的偷瞄結果p值是否小於0.05，但這種壞慣習反而容易誤導資料的判斷。事實上閱讀隨機分派研究(Randomized clinical trial)，絕對不能僅看p值來判斷研究是否具臨床意義，本周微笑想與大家分享微笑學習EBM過程中，讀到精彩好文的重要片段。

如何解讀RCT的結果

但我們設定明確PICO，並找到最佳(較佳)的隨機分派研究時，勢必先評讀研究的可信度，包括檢視研究設計中病患是否隨機分派而且分派結果是否有隱藏、病患是否有接受完整追蹤、分析時有按照病患原來安排的治療方式來分析(ITT or PP)、研究選擇的outcome 是否合適、研究信度和可重複性。

接著才是解讀隨機分派研究結果，但有點觀念一定要強調：

p 值 < 0.05 其實只代表該論文的研究結果具有統計學上意義，但是並不一定具有臨床意義(或臨床價值)；統計學上的有意義並不代表臨床上的有意義。

在解讀RCT文章結果時除了 p 值之外，還必須看effect size以及95% 信賴區間（95% CI）：

1. Effect size的計算

對於二分法的結果(例如是否會患中風，是否會住院，是否XXX…)，我們常用 odds ratio(勝算比), relative risk(相對危險性)，或absolute risk reduction(ARR,絕對風險比率差)來表示治療效果；而對於存活分析的研究，我們則用hazard ratio或是median survival time difference來表示；而對於連續性的結果，常採用Hedges effect size 計算，effect size =（Mean_treatment – Mean_control）/SD_pooled 。

【註】：

odd ratio(OR)：實驗組中發生疾病的勝算與控制組中發生疾病的勝算比值，以下圖範例說明，OR =實驗組勝算/對照組勝算= (A/B) / (C/D)=0.21
Relative Risk(RR)：接受治療病人相對於未接受治療病人的不良事件風險，以下圖範例說明，RR=實驗組發生率/對照組發生率=[A/(A+B)] / [C/(C+D)] = 0.25，表示相對於對照組，實驗組副作用發生率下降75%。RR可以讓結果差異較明顯，但也比較容易忽略到"發生率"。
absolute risk reduction(ARR)：絕對風險比率差，以下圖範例說明，ARR=|實驗組發生率 – 控制組發生率|=|[A/(A+B)] - [C/(C+D)] |=0.15，表示實驗組副作用發生率比對照組少了15%。雖然ARR可以反應出發生率，但有時很難讓人看出它所代表的臨床意義。

2. 信賴區間

RCT的研究中所得到的effect size其實只是一個估計值，真正的治療效果在現實上是無法估計到的。因此RCT研究中，會計算所謂的信賴區間，一般常用95% confidence interval(95% CI)，代表研究中真正的effect size值有95%的機會將落在此區間內。換個想法，95%信賴區間反應出研究的「精確度」，愈研究樣品數愈大，理論上95%信賴區間就會愈狹窄(愈精確)。一個良好設計的RCT研究，會先以pilotstudy的研究結果來找出合理的effect size，然後利用此effect size和預先設定的α值和power值來計算所需的sample size，等到研究招募到target 的sample size時，當追蹤的時間足夠時，就可進行最終的data分析。所以看Effect size時，也要同時看信賴區間。

3. p 值

p值含意是當兩組是沒差別時，但我們認為他們有差別的犯錯機會，一般設定如果 p < 0.05，則我們認為兩組有差別。但相同的effect size但是如果sample size不同，所算出的 p值就也不相同。許多p<0.05的研究可能是因為樣本數量大，而並非其具臨床上的意義；而許多p>0.05的研究，可能因為樣本數不足，造成underpower，而使p>0.05，所以決定不能僅看p值去判斷研究是否具臨床意義。

4. 統計學上的有意義並不代表臨床上的有意義

舉個例子，有某個降血壓新藥可以降低血壓 2mmHg，samplesize = 1000, p < 0.05，雖然p值有意義，但你覺得這個要具有臨床價值嗎？同樣的一個p > 0.05 的研究，並不代表新藥沒有臨床價值，而是有可能是因為sample size不足，而使得統計學無法呈現差別。判別RCT的研究結果，建議必須同時看effect size、信賴區間、sample size、p值。

5. 資料的獨立性

期刊上容易看到的統計方法諸如chi-square test，t-test，ANOVA，logistic regression等，這些統計方法都是立基於每筆資料都是獨立的。然而有某些研究的data是相依的，這些相依資料分析會運用到特定的統計方法，例如 repeated measure ANOVA，linear mixedmodel，GEE model，或是multilevel analysis。在分析資料時對於資料到底是獨立還是有相依性的判定是很重要的，如果用錯容易會讓分析結果較不客觀。

掌握以上5個解讀技巧，能讓我們用更公平的角度去審視各試RCT。

參考資料：