通常利用實證醫學技巧找尋到相關研究時,總是迫不急待的偷瞄結果p值是否小於0.05,但這種壞慣習反而容易誤導資料的判斷。事實上閱讀隨機分派研究(Randomized clinical trial),絕對不能僅看p值來判斷研究是否具臨床意義,本周微笑想與大家分享微笑學習EBM過程中,讀到精彩好文的重要片段。
但我們設定明確PICO,並找到最佳(較佳)的隨機分派研究時,勢必先評讀研究的可信度,包括檢視研究設計中病患是否隨機分派而且分派結果是否有隱藏、病患是否有接受完整追蹤、分析時有按照病患原來安排的治療方式來分析(ITT or PP)、研究選擇的outcome 是否合適、研究信度和可重複性。
接著才是解讀隨機分派研究結果,但有點觀念一定要強調:
p 值 < 0.05 其實只代表該論文的研究結果具有統計學上意義,但是並不一定具有臨床意義(或臨床價值);統計學上的有意義並不代表臨床上的有意義。
在解讀RCT文章結果時除了 p 值之外,還必須看effect size以及95% 信賴區間(95% CI):
1. Effect size的計算
對於二分法的結果(例如是否會患中風,是否會住院,是否XXX…),我們常用 odds ratio(勝算比), relative risk(相對危險性),或absolute risk reduction(ARR,絕對風險比率差)來表示治療效果;而對於存活分析的研究,我們則用hazard ratio或是median survival time difference來表示;而對於連續性的結果,常採用Hedges effect size 計算,effect size =(Meantreatment – Meancontrol)/SDpooled 。
【註】:
- odd ratio(OR):實驗組中發生疾病的勝算與控制組中發生疾病的勝算比值,以下圖範例說明,OR =實驗組勝算/對照組勝算= (A/B) / (C/D)=0.21
- Relative Risk(RR):接受治療病人相對於未接受治療病人的不良事件風險,以下圖範例說明,RR=實驗組發生率/對照組發生率=[A/(A+B)] / [C/(C+D)] = 0.25,表示相對於對照組,實驗組副作用發生率下降75%。RR可以讓結果差異較明顯,但也比較容易忽略到"發生率"。
- absolute risk reduction(ARR):絕對風險比率差,以下圖範例說明,ARR=|實驗組發生率 – 控制組發生率|=|[A/(A+B)] - [C/(C+D)] |=0.15,表示實驗組副作用發生率比對照組少了15%。雖然ARR可以反應出發生率,但有時很難讓人看出它所代表的臨床意義。
2. 信賴區間
RCT的研究中所得到的effect size其實只是一個估計值,真正的治療效果在現實上是無法估計到的。因此RCT研究中,會計算所謂的信賴區間,一般常用95% confidence interval(95% CI),代表研究中真正的effect size值有95%的機會將落在此區間內。換個想法,95%信賴區間反應出研究的「精確度」,愈研究樣品數愈大,理論上95%信賴區間就會愈狹窄(愈精確)。一個良好設計的RCT研究,會先以pilotstudy的研究結果來找出合理的effect size,然後利用此effect size和預先設定的α值和power值來計算所需的sample size,等到研究招募到target 的sample size時,當追蹤的時間足夠時,就可進行最終的data分析。所以看Effect size時,也要同時看信賴區間。
3. p 值
p值含意是當兩組是沒差別時,但我們認為他們有差別的犯錯機會,一般設定如果 p < 0.05,則我們認為兩組有差別。但相同的effect size但是如果sample size不同,所算出的 p值就也不相同。許多p<0.05的研究可能是因為樣本數量大,而並非其具臨床上的意義;而許多p>0.05的研究,可能因為樣本數不足,造成underpower,而使p>0.05,所以決定不能僅看p值去判斷研究是否具臨床意義。
4. 統計學上的有意義並不代表臨床上的有意義
舉個例子,有某個降血壓新藥可以降低血壓 2mmHg,samplesize = 1000, p < 0.05,雖然p值有意義,但你覺得這個要具有臨床價值嗎?同樣的一個p > 0.05 的研究,並不代表新藥沒有臨床價值,而是有可能是因為sample size不足,而使得統計學無法呈現差別。判別RCT的研究結果,建議必須同時看effect size、信賴區間、sample size、p值。
5. 資料的獨立性
期刊上容易看到的統計方法諸如chi-square test,t-test,ANOVA,logistic regression等,這些統計方法都是立基於每筆資料都是獨立的。然而有某些研究的data是相依的,這些相依資料分析會運用到特定的統計方法,例如 repeated measure ANOVA,linear mixedmodel,GEE model,或是multilevel analysis。在分析資料時對於資料到底是獨立還是有相依性的判定是很重要的,如果用錯容易會讓分析結果較不客觀。
掌握以上5個解讀技巧,能讓我們用更公平的角度去審視各試RCT。
參考資料:
- 臨床醫師閱讀隨機分派研究(Randomized clinical trial)論文應有的正確觀念. 臺灣醫界雜誌2010, Vol.53, No.10
留言列表