如何评估偏倚风险?柯克兰偏倚风险评估工具简介

日期:2019-01-24    作者:中国全科医学学术平台       分享:

01什么是偏倚?


偏倚的本质,是一种系统性误差。它往往会致使一个研究的结论或推论背离真实情况。


在方向上,偏倚可以表现为“低估”或“高估”的形式;在量级上,也可以表现为“微小“或“大量”等多种形式。偏倚往往是由实验设计的缺陷或现实条件的限制所导致的,一般情况下,很难精确测得偏倚对特定研究结果的影响程度。


但是,偏倚与“不精确”却是两个截然不同的概念。“精确性”通常是指随机误差的大小,即因为抽样的影响,多次重复进行该研究,将产生出不同的效应估计;而“偏倚”则是指系统性误差,即:即便对一个研究进行多次重复,依然会得出一个背离真实的结论。


同样,偏倚也不完全等同于“低质量”。所谓的“质量”,通常是指“人们可以相信效果估计值接近结果真实值的程度”,是一个相较于偏倚更加宏观的概念。通常情况下,偏倚的存在与强弱会在一定程度上影响研究的质量,但也有反例,比如一些高质量的RCT(随机对照)研究可能存在表现偏倚或检测偏倚,因为盲法在一些客观条件下是不能用在试验当中的,在这种情况下,因为存在偏倚,就说这个研究是低质量的,这样的评价就是不妥当的。


02我们为什么要评估偏倚?


最主要的原因,还是我们需要通过对偏倚的评估,了解一个研究的内部效度。


所谓效度,是指研究方法中,结论或测量方式是否被良好的确立,以及能否准确地反映真实世界情况及程度。


一个研究的效度,通常表现为两个方面。


第一是外部效度,即研究的普适性或实用性,通常是由一个研究所提出的问题所决定的。第二是内部效度,它与偏倚有着直接联系,通常表现为一个研究的结论,是否准确回答了这个研究所提出的问题。而偏倚的存在,恰恰会将研究导向一个错误的,无法准确回答该研究所提出的问题的结论,从而降低研究的内部效度。


因此,了解一个研究的偏倚程度,就成为了我们决定是否采信该研究结论的先决条件之一。对偏倚风险的评估,在一定程度上减少了“报告质量”与“研究质量”二者之间的模糊地带,使我们得以对研究的内部效度做出更加准确的判断。


03柯克兰偏倚风险评估工具  


柯克兰偏倚风险评估工具(The Cochrane Collaboration’s tool for assessing risk of bias in randomized trials),是当前循证医学领域最通用的偏倚风险评估工具之一,主要适用于RCT研究。它于2005年开始研发,在2008年正式发布第一版,在2011年进行了修订,并在2016年发布了目前仍在改进的第二个版本。


目前,在设计较为成熟,使用也较广的第一版工具中,它将主要的偏倚种类分为以下六类七种,并将每一种偏倚风险划为了“高风险”、“低风险”和“风险不明”三档(表1)。




4使用风险评估工具的原则  

在于2011年刊登于BMJ的准官方说明中,曾着重强调,使用柯克兰偏倚风险评估工具评估偏倚风险,需要遵循七个原则,其大意如下:


1.不要使用量化打分的思维

这主要是因为量化打分表的思维往往倾向于将研究的多个方面评估结果混杂在一起,以一种难以证明的方式为不同的项目分配权重(分数),和计算总值。但实际上,无论是从理论还是实证上看,对于不同的干预效果,其评估的尺度都是不一致的,也是不可预测的,需要具体问题具体分析,而不能用一种简单粗暴,一劳永逸的量化打分来下定论。


2.聚焦于内部效度

在评估偏倚的时候,将对内部效度(如前所述,与偏倚密切相关),外部效度(一般性或适用性),以及精确度(研究结果在多大程度上没有随机误差)的评估分开,这是非常有必要的。一个研究可能没能提出一个具有普适性的问题,但这并不代表它的内部效度就不佳,没能有效的避免偏倚。


3.不要被研究的质量或方法学问题带偏思路

同理,研究报告的质量与是否存在偏倚并不等同。如作者对研究的一些细节的描述,并不直接与偏倚风险相关,又如是否获得道德批准与样本量结算这类方法学问题,与偏倚风险也没有直接关系。因此,在单纯评估偏倚风险的时候,不必要将这些因素考虑在内。


4.评估偏倚风险需要必要的知识与能力

想要评估实验过程是否为其结果带来了偏倚风险,对试验方法的充分了解,以及具备对其可能带来的偏倚风险做出判断的能力,都是不可或缺的前提。此外,对偏倚风险的评估,需要建立在对试验的各方面充分记录的基础上,包括判断本身也应记录。


5.需要结合理论与现实经验,来具体选择需要评估偏倚风险的领域

很多时候,在实践当中,造成偏倚的来源会大于理论所指出的范畴。此外,研究的类型、目的、方法的不同,也会使较可能产生偏倚的领域不同。因此,就需要具体研究具体分析,找到较可能造成偏倚的领域和研究步骤。


6.聚焦于审核中所呈现的数据,而非原始数据的偏倚风险。

一些论文所报告的研究结果,可能会被认为具有较高的偏倚风险。但这类研究,也是有可能重新推导出偏倚风险较低的结果。如一篇不恰当地将某些患者排除在分析之外的论文,可能也会报告这些患者的干预组和结果,这样就可以将那些被忽略的参与者重新纳入到考虑当中,推出内部效度更高的结果来。


7.评估研究的特定结果的偏倚风险。

试验的一些方面,如盲法的使用,可能会造成整个研究的偏倚风险。但是,偏倚风险更多的是针对试验中的不同结果,因此就需要具体情况具体分析。比如全因死亡率,它可以通过查询去世注册单来确认,这一行为带来的偏倚风险较低;但癌症的复发,则需要通过具有相应知识的医生来进行评估,这其中的偏倚风险就较高。


综上,在使用柯克兰偏倚风险评价工具时,对评价者最为重要的一个原则,就是“掌握理论,活用工具,结合实际,具体分析”,它需要评价者首先对RCT研究的实验设计有相当的了解,其次对要评估偏倚风险的研究,特别是方法与数据的部分进行深入的理解,之后在对该研究的方法,主要结局与核心数据有充分了解的基础上,再做出具体的评价。


通常情况下,为保证柯克兰偏倚风险评估工具对研究进行偏倚评估的可靠性,建议两个以上的评估者同时使用工具对研究进行评估,并对比其评估结果,进行判断一致性的检验。


05使用风险评估工具进行偏倚判断的参考标准


在柯克兰系统干预评价手册(Cochrane Handbook for Systematic Reviews of Interventions)中,针对偏倚风险评估工具,提供了很有价值的细节判断标准。它是对偏倚风险评估工具很好的细化和补充(表2)。

 

引自:Cochrane handbook for systematic reviews of interventions


参考资料:

[1]Cochrane Collaboration. Cochrane handbook for systematic reviews of interventions[M]. Cochrane Collaboration, 2008.

[2]Higgins J P T, Altman D G, G?tzsche P C, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials[J]. Bmj, 2011, 343: d5928.

[3]Costa B R, Beckett B, Diaz A, et al. Effect of standardized training on the reliability of the Cochrane risk of bias assessment tool: a prospective study[J]. Systematic reviews, 2017, 6(1): 44.