临床试验设计的统计学注意事项

随机对照临床试验（Randomized Controled Trial, RCT）是常见的重要的循证医学证据，为临床诊治提供重要依据。在临床试验设计中，专业设计和统计学设计都很重要。统计学设计包括：确定样本量的大小，分组方法，控制偏移（随机、盲法），需要收集的数据（评价指标），分析数据的统计学方法等。临床试验的统计学设计的三大原则分别为重复、随机和对照。从本期文章起，将以麻醉学重要临床研究论文为例，介绍常见的统计学注意事项和误区，帮助广大临床医师和研究人员更好地开展前瞻性或回顾性临床研究。本文将以 2018 年发表在《Br J Anaesth》上的「Desflurane reduces intraoperative remifentanil requirements more than sevoflurane: comparison using surgical pleth index-guided analgesia」这篇研究为例，简要介绍临床试验设计中常见的统计学注意事项。

研究摘要

七氟烷和地氟烷与阿片类镇痛药联合广泛用于手术麻醉。阿片类药物瑞芬太尼药代动力学极快，在临床上使用广泛。但是，由于急性耐受和阿片类药物引起的痛觉过敏，术中大剂量瑞芬太尼导致术后疼痛增加，抢救性镇痛药物的使用增加。本研究旨在比较术中瑞芬太尼在相同最小肺泡浓度 (MAC) 七氟醚和地氟醚麻醉下的应用。

研究将 82 例腹腔镜胆囊切除术患者随机分为七氟烷组 (n = 40) 和地氟烷组 (n = 42)。使用指定的吸入麻醉和瑞芬太尼维持麻醉。潮气末麻醉浓度维持在经年龄校正的 1.0 MAC，持续调整瑞芬太尼输注量，以达到 SPI 指数（surgical pleth index）在 20-50 之间。本研究的主要结果为平均瑞芬太尼输注率，其计算方法为总手术时间每分钟每公斤体重输注瑞芬太尼总剂量。

本研究流程图如下所示：

研究结果发现，七氟烷组平均瑞芬太尼注入率 (平均值 (标准差)) 显著高于地氟烷组 [0.192(0.064) 和 0.099(0.033) μg kg-1 min-1，差值为 0.093(95% CI: 0.071-0.115);P < 0.001)。

统计学要点

敲黑板——

一、样本量的估算

需根据研究设计类型、预实验或文献结果进行估算。若比较两样本均数时样本含量可用以下公式计算：

n＝2*[(α+β)σ/δ]^2（式中 δ 为要求的区分度，σ 为总体标准差或其估计值 s，α、β 分别是对应于 α 和 β 的 u 值，α 有单侧、双侧之分，β 只取单侧值）。

需注意的是，根据研究目的的不同应选用对应的样本量计算公式。该研究为前瞻性研究，应考虑到失访的可能性，故一般需再加 10% 的样本量。

可以看到，本研究共纳入 82 例受试者的依据如下：样本大小的计算基于 30 例的预实验研究，每组 15 例。其中术中平均瑞芬太尼输注速率 [均值（标准差，SD）] 七氟烷组为 0.172（0.065）μg/kg^-1 min^-1，地氟烷组 0.132（0.045）μg kg^-1 min^-1。以双侧 t 检验，检验效能为 90%，显著性水平为 5%， 10% 失访率，估计每组样本量为 40 名患者，需招募 90 名患者。

除此以外，也可以用一些在线网站或软件进行样本量估计，如 PASS（power analysis and sample size）、SAS Power and Sample Size application（PSS）等等。

二、偏倚的控制：随机化和盲法

随机化和盲法的研究设计可以在一定程度上降低人为因素的干扰，降低结果偏倚，其操作必须按照标准操作规程进行。盲法常用「单盲」或「双盲」。本文研究者采用了以下方法：

✔ 随机化：符合条件的患者通过基于在线网站（www.randomization.com），使用随机置换的区块随机算法，随机分为两组（七氟醚和地氟醚组）。

✔ 盲法：使用连续编号的不透明信封进行盲法，每个信封中都包含一张说明麻醉剂的折叠纸，并由独立研究人员在远离医院的实验室中存储和打开。打开信封后，组分配未更改。

三、检测/结局指标的收集和统计分析

设计合适的检测指标直接影响到研究结论的可靠性。一般可包括：入组病人基线特征的组间比较、主要分析指标与多重比较、intention-to-treat 分析、某治疗指标前后改变量的分析、调整不均衡变量的分析等。

本研究收集数据包括：1. 诱导前数据。2. 切口前数据。3. 术中数据。每个时间点的测量窗口为 1 分钟，并以 30 s 的间隔记录数据。因此，使用所有检测数据在 1 分钟内两次测量的平均值。数据由独立研究人员手动记录，而该研究人员不知晓对小组分配情况。结果的分析方法将在今后的推文中再详细介绍。

四、数据管理

临床试验最基础的工作是保证研究原始试验资料和档案的真实、科学、规范和完整。数据管理的目的是将得自受试者的数据迅速、完整、无误地纳入报告。数据管理包括根据试验方案所制定的病例报告表（case report form, CRF）的规范化操作。研究者是数据填写的第一执行者，监察员需核实研究者填写的数据真实、可信。数据管理员将 CRF 表数据完整真实地录入计算机。统计分析人员对数据的逻辑合理进行检查，并对数据锁定直至做出统计分析，撰写统计分析报告。

统计分析常见误区

那些年跳过的坑——

1. 纳入病例标准不明确：临床研究设计时，必须明确入组标准和排除标准，以及分组依据。在试验实施时，严格按照纳入标准筛选人群。

2. 检测/结局指标过多：检测或结局指标并非越多越好。更不能检测大量指标，最后挑选有统计学差异的指标作统计。在试验设计时就必须明确能够得出科学结论的最重要检测/结局指标。

3. 多重比较不校正：对一组数据作多项比较时，需要校正 α 值，而不能统一选择 0.05。常用 Bonfferoni 校正。例如，同时分析 2 个指标时，P≈0.1。

4. 样本量无依据：发表临床试验时，必须提供最小样本量估算及依据。估算方法根据样本为参数/非参数、均数/率的比较、把握度等不同而选用不同的计算方法。

5. 随机化和盲法不明确：随机对照、单/双盲临床试验发表时一般均需要写明随机化和盲法的实施方法。随机分组不是「随意分组」或「机械分组」。

6. 过分强调 P 值：过分强调 P 值是否小于 0.05，而忽略统计学估计的倾向；片面地认为越复杂的统计方法越好，而忽视统计检验方法的适用性和恰当性。

总结

由此可见，符合统计学原则的临床研究是结果能够推广的基础。临床试验的统计设计主要包括：1、根据研究目的的不同应选用对应的样本量计算公式，或利用在线网站计算；2、将病人按随机算法进行入组，有条件最好采取「双盲」；3、检测/结局指标和统计方法需要事先严谨设计，足够得出科学结论；4、规范撰写 CRF 表，并将 CRF 表数据完整真实地录入计算机。总之，临床试验设计的统计分析原则符合临床研究的一般原则，包括科学精神，既要提出试验分析的成果，也要指出本身研究和统计设计的局限；贴近临床，统计方法和统计结果须具有临床指导价值；最后是做好充足的知识储备，站在巨人的肩膀上，借鉴好的设计方法。在今后的推文中，还将继续介绍临床研究中重要的统计方法，为临床医生提供参考。

【参考文献】

Ryu KH et al. Desflurane reduces intraoperative remifentanil requirements more than sevoflurane: comparison using surgical pleth index-guided analgesia. Br J Anaesth. 2018 Nov;121(5):1115-1122.

更多干货内容，关注百特围术期微信公众号了解！