解決臨床實際問題時,必須針對臨床問題找尋最佳的證據,而其中證據等級最高非systematic review莫屬,本周微笑整理systematic review評讀的技巧,協助大家判斷文獻的效性(validity)、影響性(impact)、以及適用性(applicability)。
本文以CASP評讀工具匯整而成…
(1)審視文章標題與摘要中研究目的是否與目前臨床問題相同。
(2)文章收納證據等級高低
優先收納證據等級較高的 RCT (randomized controlled trial 隨機對照試驗)。摘要 (Abstract)或方法 (Methods)中的研究選擇 (study selection)能找到答案。
(3)檢視作者的搜尋策略是不是適當
例如搜尋的資料庫 (database)是否齊全,搜尋的關鍵字是否適當(使用MeSH term?)或有無重點相關文獻被遺漏等。可以從研究方法 (Methods)中文獻搜尋 (study selection)的部分審查。不少人會利用漏斗圖 (funnel plot)的對稱性 (asymmetry)來檢視系統性回顧所納入的文獻是否有出版誤差 (publication bias),但事實上若漏斗圖具不對稱性的證據,發表性誤差只是眾多解釋中的其中一個罷了。
由上圖漏斗圖的座標可以看出,橫軸為勝算比 (odds ratio) 或風險比 (risk ratio),兩種治療 (藥物或其他治療) 效果比值;縱軸為標準誤 (standard error),代表單一研究結果 (估計值) 的精確度,樣本數目越大,標準誤將會越小,因此,越上面的研究 (就是圖中的點),代表標準誤越小 (等於樣本數目越大)。當研究數目 (每個小點) 少於10個,原則上不畫漏斗圖,超過10個,認真用肉眼判斷是否對稱,若不對襯,可採用迴歸 (regression) 檢定的方式,常見的例如Egger's test,檢定發表性偏誤是否存在。
另外值得一提的是,如果漏斗圖明顯具不對襯性,不同的「統計方法進行綜合分析」可能會有極大的差異,因為隨機效應模式 (random effects model) 比起固定效應模式 (fixed effect model) 在計算各研究的權重 (weight) 時,納入了研究之間的變異 (between study variance),所以當不對稱性存在時,隨機效應模式會讓比較小型的研究得到比較大的影響力,進而影響最終結果。專家們建議,當漏斗圖呈現不對稱時,應該分別呈現固定效應模式與隨機效應模式的分析結果 (因為非常可能有顯著差異)。若覺得似懂非懂,可以看NEJS部落格有詳細的解說。
(4)審查納入文獻的品質
仔細審查作者是否有適當的去評讀這些收納的文獻並給予分數,常見評讀工作如Cochrane Risk of Bias (RoB) Tool、Jadad scale、CASP等,可以在文章中方法(Methods)中品質評估 (quality assessment)的部分找到答案,並 (有時)可以在表格一 (Table 1. Baseline Characteristics of Trials)看到評讀後的結果,或者作者會把它藏到附件去。
(5)文獻結果是否合併,適當與否?
主要原因在於,並不是所有的系統性回顧 (systematic review)都適合把結果合併成一個值,變成統合分析 (meta-analysis),例如研究彼此間研究設計差異太大、異質性 (heterogeneity)太大時。通常可以從文章尋找方法 (Methods)中統計分析 (statistical analysis)的描述部分判斷合理性。常用來闡述研究間異質性的統計方法如下:
- I2值:通常介於0-100%,數字越大異質性越大,可分為低 (25%)、中 (50%)、高 (75%)異質性,但事實上 I2值低,不代表研究間異質性低,也有可能是檢定力不足。
-
Cochrane's Q (p值):一般 p值<0.1 (而不是 0.05,因 檢定力不是很足夠)我們就會判定這些研究間存在顯著的異質性。
- Forest plot(森林圖)
當收納研究數目不多時,I2值的檢定力 (power)會不足,也就是出現 I2值不高,但光肉眼看 forest plot (森林圖)就知道研究結果間明明有差異,這時候會希望作者有提供 I2值的 95%信賴區間給我們參考。
統合分析的兩種統計方法:fixed-effect model (固定效應模式)及random-effects model (隨機效應模式)。簡單來說,固定效應模式假設這些研究結果是來自同一個母群體 (有一個共同的真實效果),而每篇研究所觀察到的結果不同,會歸因於取樣誤差。而隨機效應模式為假設每篇研究的母群體都不同,因為每篇論文的病患族群、年齡分布、藥物治療或劑量、追蹤時間不同,而造成了每篇研究取樣來自不同母群體、而有各自不同的真實效果 (並假設這些真實效果會呈常態分佈)。詳情可以參考NEJS部落格有詳細的解說。
如果研究間存在異質性 (除了看 I2值,也要加上我們自己的判斷,到底這些研究有沒有差異),就不應該使用固定效應模式進行分析,通常有以下作法:
- 不要合併,然後檢討異質性的可能性 。
- 捨棄固定效應模式 (fixed-effect model) 改用隨機分派模式 (random-effect model)
- 找出可能的原因,找出哪些不適合的研究,重新評估,選擇分開分析,也就是我們常聽到的次群組分析 (subgroup-analysis),或分析時予以刪除。
(6)判讀系統性回顧的結果
一般系統性回顧最後有做到 meta-analysis都會呈現出 forest plot(森林圖)。判斷原則如下:
- 中間會有一條垂直線 1表示 odd ratio (OR勝算比)=1或 relative risk (RR相對風險)=1,值落在 1的左邊表示風險降低,右邊表示風險增加,跨過 1表示沒有統計學上的差異。
- 每一條橫線表示一個研究結果的 95%信賴區間 (95%CI, 95% confidence interval),有的會寬、有的會窄 (愈窄表示該研究越精確)。
- 橫線中間的正方形為點估計值,越大顆表示該值對此 meta-analysis的貢獻度或權重 (weight)越高(樣本數愈大)。
以下圖來說,最後結果OR 0.53 (95%CI 0.32-0.88; p=0.01),顯示相對於對照組,實驗組下降了47%的死已率。
(7)研究結果夠精確嗎?
首先要看預計收納的病患樣本數有沒有達到 (並納入分析),使其達到足夠的檢定力。接下來要看看 95%信賴區間的上下限值,若 95%CI上下值差異能小於 0.25一般來說會認為精確度很好,如果大於 0.5可能就不是那麼精確,但要隨著研究題目、臨床問題而定。
掌握以上幾個幾點,就能迅速有意義的解讀手上的臨床系統性回顧文獻。
留言列表