围术期学院
临床试验设计的统计学注意事项

随机对照临床试验(Randomized Controled Trial, RCT)是常见的重要的循证医学证据,为临床诊治提供重要依据。在临床试验设计中,专业设计和统计学设计都很重要。统计学设计包括:确定样本量的大小,分组方法,控制偏移(随机、盲法),需要收集的数据(评价指标),分析数据的统计学方法等。临床试验的统计学设计的三大原则分别为重复、随机和对照。从本期文章起,将以麻醉学重要临床研究论文为例,介绍常见的统计学注意事项和误区,帮助广大临床医师和研究人员更好地开展前瞻性或回顾性临床研究。本文将以 2018 年发表在《Br J Anaesth》上的「Desflurane reduces intraoperative remifentanil requirements more than sevoflurane: comparison using surgical pleth index-guided analgesia」这篇研究为例,简要介绍临床试验设计中常见的统计学注意事项。

研究摘要

七氟烷和地氟烷与阿片类镇痛药联合广泛用于手术麻醉。阿片类药物瑞芬太尼药代动力学极快,在临床上使用广泛。但是,由于急性耐受和阿片类药物引起的痛觉过敏,术中大剂量瑞芬太尼导致术后疼痛增加,抢救性镇痛药物的使用增加。本研究旨在比较术中瑞芬太尼在相同最小肺泡浓度 (MAC) 七氟醚和地氟醚麻醉下的应用。

 

研究将 82 例腹腔镜胆囊切除术患者随机分为七氟烷组 (n = 40) 和地氟烷组 (n = 42)。使用指定的吸入麻醉和瑞芬太尼维持麻醉。潮气末麻醉浓度维持在经年龄校正的 1.0 MAC,持续调整瑞芬太尼输注量,以达到 SPI 指数(surgical pleth index)在 20-50 之间。本研究的主要结果为平均瑞芬太尼输注率,其计算方法为总手术时间每分钟每公斤体重输注瑞芬太尼总剂量。    

 

本研究流程图如下所示:

研究结果发现,七氟烷组平均瑞芬太尼注入率 (平均值 (标准差)) 显著高于地氟烷组 [0.192(0.064) 和 0.099(0.033) μg kg-1 min-1,差值为 0.093(95% CI: 0.071-0.115);P < 0.001)。

 

统计学要点

敲黑板——

一、样本量的估算

需根据研究设计类型、预实验或文献结果进行估算。若比较两样本均数时样本含量可用以下公式计算:

n=2*[(α+β)σ/δ]^2(式中 δ 为要求的区分度,σ 为总体标准差或其估计值 s,α、β 分别是对应于 α 和 β 的 u 值,α 有单侧、双侧之分,β 只取单侧值)。

 

需注意的是,根据研究目的的不同应选用对应的样本量计算公式。该研究为前瞻性研究,应考虑到失访的可能性,故一般需再加 10% 的样本量。

 

可以看到,本研究共纳入 82 例受试者的依据如下:样本大小的计算基于 30 例的预实验研究,每组 15 例。其中术中平均瑞芬太尼输注速率 [均值(标准差,SD)] 七氟烷组为 0.172(0.065)μg/kg-1 min-1,地氟烷组 0.132(0.045)μg kg-1 min-1。以双侧 t 检验,检验效能为 90%,显著性水平为 5%, 10% 失访率,估计每组样本量为 40 名患者,需招募 90 名患者。

 

除此以外,也可以用一些在线网站或软件进行样本量估计,如 PASS(power analysis and sample size)、SAS Power and Sample Size application(PSS)等等。

 

二、偏倚的控制:随机化和盲法

随机化和盲法的研究设计可以在一定程度上降低人为因素的干扰,降低结果偏倚,其操作必须按照标准操作规程进行。盲法常用「单盲」或「双盲」。本文研究者采用了以下方法:

 

随机化:符合条件的患者通过基于在线网站(www.randomization.com),使用随机置换的区块随机算法,随机分为两组(七氟醚和地氟醚组)。

盲法:使用连续编号的不透明信封进行盲法,每个信封中都包含一张说明麻醉剂的折叠纸,并由独立研究人员在远离医院的实验室中存储和打开。打开信封后,组分配未更改。

 

三、检测/结局指标的收集和统计分析

设计合适的检测指标直接影响到研究结论的可靠性。一般可包括:入组病人基线特征的组间比较、主要分析指标与多重比较、intention-to-treat 分析、某治疗指标前后改变量的分析、调整不均衡变量的分析等。

 

本研究收集数据包括:1. 诱导前数据。2. 切口前数据。3. 术中数据。每个时间点的测量窗口为 1 分钟,并以 30 s 的间隔记录数据。 因此,使用所有检测数据在 1 分钟内两次测量的平均值。数据由独立研究人员手动记录,而该研究人员不知晓对小组分配情况。结果的分析方法将在今后的推文中再详细介绍。

 

四、数据管理

临床试验最基础的工作是保证研究原始试验资料和档案的真实、科学、规范和完整。数据管理的目的是将得自受试者的数据迅速、完整、无误地纳入报告。数据管理包括根据试验方案所制定的病例报告表(case report form, CRF)的规范化操作。研究者是数据填写的第一执行者,监察员需核实研究者填写的数据真实、可信。数据管理员将 CRF 表数据完整真实地录入计算机。统计分析人员对数据的逻辑合理进行检查,并对数据锁定直至做出统计分析,撰写统计分析报告。

 

统计分析常见误区

那些年跳过的坑——

1.  纳入病例标准不明确:临床研究设计时,必须明确入组标准和排除标准,以及分组依据。在试验实施时,严格按照纳入标准筛选人群。

2.  检测/结局指标过多:检测或结局指标并非越多越好。更不能检测大量指标,最后挑选有统计学差异的指标作统计。在试验设计时就必须明确能够得出科学结论的最重要检测/结局指标。

3.  多重比较不校正:对一组数据作多项比较时,需要校正 α 值,而不能统一选择 0.05。常用 Bonfferoni 校正。例如,同时分析 2 个指标时,P≈0.1。

4.  样本量无依据:发表临床试验时,必须提供最小样本量估算及依据。估算方法根据样本为参数/非参数、均数/率的比较、把握度等不同而选用不同的计算方法。

5.  随机化和盲法不明确:随机对照、单/双盲临床试验发表时一般均需要写明随机化和盲法的实施方法。随机分组不是「随意分组」或「机械分组」。

6.  过分强调 P 值:过分强调 P 值是否小于 0.05,而忽略统计学估计的倾向;片面地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。

 

总结

由此可见,符合统计学原则的临床研究是结果能够推广的基础。临床试验的统计设计主要包括:1、根据研究目的的不同应选用对应的样本量计算公式,或利用在线网站计算;2、将病人按随机算法进行入组,有条件最好采取「双盲」;3、检测/结局指标和统计方法需要事先严谨设计,足够得出科学结论;4、规范撰写 CRF 表,并将 CRF 表数据完整真实地录入计算机。总之,临床试验设计的统计分析原则符合临床研究的一般原则,包括科学精神,既要提出试验分析的成果,也要指出本身研究和统计设计的局限;贴近临床,统计方法和统计结果须具有临床指导价值;最后是做好充足的知识储备,站在巨人的肩膀上,借鉴好的设计方法。在今后的推文中,还将继续介绍临床研究中重要的统计方法,为临床医生提供参考。

 

【参考文献】

Ryu KH et al. Desflurane reduces intraoperative remifentanil requirements more than sevoflurane: comparison using surgical pleth index-guided analgesia. Br J Anaesth. 2018 Nov;121(5):1115-1122.

 

更多干货内容,关注百特围术期微信公众号了解!

发表观点