循证的保质期有多长?拨开云雾:糖尿病RCT证据评价与解读

数据显示,自 1951 年至今,2 型糖尿病(T2DM)研究文献多达 16 万篇以上。其中,随机对照研究(RCT)是降糖药物干预性研究的首选金标准方案,例如发表于 1998 年、源自经典英国前瞻性糖尿病研究(UKPDS)中的各个系列研究。但随着时代发展,既往 RCT 证据的循证等级和质量会过期吗?对于这个有趣的问题,本文或许能解答一些疑惑。

温故知新:UKPDS 研究系列文献一览

UKPDS 研究系列发表于 20 年前,探讨了二甲双胍强化血糖控制对终点事件的影响,总共历时 20 年,不仅是医学史上耗时最长的研究之一,也是糖尿病治疗发展史上的里程碑。

1. UKPDS 34 研究:证实二甲双胍心血管获益

UKPDS 34 研究共纳入 1704 例超重或肥胖(> 理想体重的 120%)的新诊断 T2DM 患者,随机分为常规单纯饮食控制治疗组(n = 411)、二甲双胍强化控糖组(n = 342)或磺脲类/胰岛素强化控糖组(n = 951),中位随访 10.7 年 [1]

结果显示(图 1),与常规治疗相比,二甲双胍治疗可显著降低心血管事件风险,其中心肌梗死风险下降 39%(P = 0.01),心血管事件复合终点(心肌梗死、猝死、心绞痛、卒中和周围血管疾病)风险下降 30%(P = 0.020);并降低全因死亡风险 36%(P = 0.011),降低任何糖尿病相关终点风险 32%(P = 0.002)。与磺脲类/胰岛素治疗相比,二甲双胍治疗显著降低全因死亡风险(P = 0.01)。


图 1. UKPDS 34 研究:证实二甲双胍心血管获益

2. UKPDS 80 研究:证实二甲双胍心血管获益具有延续效应

UKPDS 干预研究结束后继续随访 10 年,结果显示二甲双胍的心血管获益具有延续效应,与常规治疗组相比,二甲双胍组患者心肌梗死风险下降 33%(P = 0.005),全因死亡风险下降 27%(P = 0.002)[2]

3. UKPDS 51 研究:证实二甲双胍成本效果优

UKPDS 51 研究评价了超重/肥胖 T2DM 患者应用二甲双胍强化控糖的成本效果。结果显示,与常规治疗相比,二甲双胍组患者每人成本净减少 258 英镑,这主要得益于在 10.7 年研究期内因并发症减少的成本;同期预期寿命平均延长 0.4 年 [3]

综上,UKPDS 研究系列证实了二甲双胍的心血管获益及其持续作用以及经济学效益,该研究奠定了二甲双胍的一线首选治疗地位。那么,问题来了,20 年前的研究设计是否已经过时?其研究结果是否仍被认可?下面就从 RCT 证据分级的演进说起。

不同时代阶段:糖尿病 RCT 研究证据质量该如何评价?

随着时代进步,RCT 证据分级也经历了不同阶段(图 2)。


图 2. RCT 证据分级的不同阶段

阶段 1:1979 年 CTFPHE 标准

在仅单纯考虑试验设计的早期,最具代表的是 1979 年加拿大定期体检特别工作组(CTFPHE)标准,其指出设计良好的 RCT 即为最高质量证据,其次是病例对照研究、对照研究、非对照研究和专家意见。UKPDS 系列研究在 1998 年发表之初,完全符合该标准定义的最高级别循证(Ⅰ级证据)

阶段 2:2001 年「证据金字塔」标准

在证据分级中期阶段,代表有 2001 年美国州立大学医学中心推出的「证据金字塔」和同年牛津大学循证医学中心推出的标准。根据「证据金字塔」,RCT 为仅次于系统评价/Meta 分析的高级别证据(图 3)。按此标准,UKPDS 系列研究仍居证据金字塔的顶端(Ⅰ级证据)


图 3. 证据金字塔

阶段 3:GRADE 系统

阶段 2 的分级标准存在一定局限性,其本质上仍仅考虑研究设计方法,而忽略了其他可能影响研究质量的因素。显然,并非所有 RCT 均为高质量,例如样本量小、结果相互矛盾的 RCT 证据级别就应有所折扣。这些质疑进一步推动了 GRADE 系统的诞生,即目前最新的证据分级标准 [4]

GRADE 将证据质量分为高、中、低、极低四类,RCT 初定为高质量研究,但还需从以下 5 个核心因素进一步评估,若不符合标准则可能降低证据质量,接下来我们就以证实二甲双胍有心血管获益的 UKPDS 34 研究为例,看看是否符合高质量证据

偏倚风险

偏倚风险是判断研究质量的一个重要因素。对对照试验而言,评价时需考虑这样一些特征如随机、隐蔽分组、盲法及意向治疗分析的运用,此外还需考虑失访的问题,以及设计、实施与分析中影响偏倚风险的其他因素。UKPDS 34 研究为低偏倚风险,符合高质量证据要求(图 4)。


图 4. UKPDS 34 研究为低偏倚风险

不一致性

GRADE 中的「质量」还包括「不一致性」的评估。这需综合考虑效应量方向和大小、森林图中点估计值分布和可信区间(CI)重合程度,并结合 P 值等统计学判定。UKPDS 34 研究中各终点事件的 RR = 0.58、0.59、0.61、0.64、0.68,一致性尚可(图 5),符合高质量证据要求。


图 5. UKPDS 34 研究一致性均尚可

间接性

GRADE 要求研究方法学详细说明患者人群/干预措施/对照/结果,即 PICO。例如,不同分组之间入选人群的特征、特殊人群所占的比例等可能会影响研究结果在临床实践中的应用价值。从各组间患者年龄、女性比例、体质指数(BMI)等来看,UKPDS 34 研究人文特征相似性高,间接性较小(图 6),符合高质量证据要求


图 6. UKPDS 34 研究间接性小

精确性

若研究纳入样本量相对较少,可导致可信区间较宽,从而影响结果精确性,具体可通过统计学意义、样本量以及 CI 宽窄来评估。UKPDS 34 研究纳入人群样本量较小,从 CI 来看,其精确度尚可(图 7),符合高质量证据要求


图 7. UKPDS 34 研究精确度尚可

发表偏倚

发表偏倚是指阳性结果研究较阴性结果者更易发表的现象,包括所发表刊物的影响因子更高,发表更快等。UKPDS 34 研究于 1998 年发表于 Lancet 杂志,该刊物已于 1995 年接受 RCT 试验报告统一标准(CONSORT),其发表偏倚较低

综上,根据最新的 GARDE 分级系统,从方法学(RCT 设计)以及偏倚风险、一致性、间接性、精确性、发表偏倚等综合评估来看,UKPDS 34 研究仍属于高级别证据,研究结果没有过时,仍是应该被信赖的

结语

RCT 研究重在质量,而非新旧!出自名门的 UKPDS 系列研究是高质量 RCT,20 年前完成的 UKPDS 34 研究证实二甲双胍的心血管获益,证据未过时,与目前 CVOT 研究的循证等级相当!

参考文献:
1. UK Prospective Diabetes Study (UKPDS) Group. Lancet 1998; 352(9131): 854-865.
2. Holman RR, et al. N Engl J Med. 2008; 359(15): 1577-1589.
3. Clarke P, et al. Diabetologia. 2001; 44(3): 298-304.
4. Bedford M, et al. J Clin Epidemio. 2011; 64(12): 1272-1274.