有序分类资料是特殊的分类资料类型,如疾病分期、肿瘤级别等。在进行有序分类资料组间比较时,不适用之前介绍的 Pearson 卡方检验,因为无法纳入资料「有序」的信息。本期文章将介绍适合进行有序分类变量比较的秩和检验,以及相应的 SPSS 操作方法。希望为临床医师和研究人员提供参考。
研究摘要
统计学要点
一、何为有序多分类资料
有序分类资料各类别之间在一定的标准下有高低、优劣等内在顺序逻辑的差别。资料形式可见以下两张示例表格。
可以看到,「无效」、「好转」、「治愈」和疾病分期「I 期」、「II 期」、「III 期」是有一定内在顺序的分类变量,通常按从无到有、或从轻到重的等级。
二、秩和检验
对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量 (各等级) 的频数表,所得资料称为等级资料。
卡方检验只能说明处理组效应的构成比是否有差别,但不能说明各处理组效应的大小是否有差别。按原理,卡方检验没有用到有序信息,即有序分类变换顺序后,卡方值是不变的。因此要用秩和检验,可以利用有序信息,可以说明处理组效应大小是否有差别。当然,秩和检验还可以用于非正态分布或者分布不清楚的其他类型资料,本文不做介绍。
有序多分类资料还分为单向和双向两种,好像有点被绕晕了?其实很简单,单向有序多分类资料是表格中只有行或列变量「有序」,而双项指的是行和列变量均有顺序。双向资料的分析方法和单项稍复杂,但原理相同。
三、利用 SPSS 数据加权实现有序分类资料的比较
与前几期类似,有序分类资料的检验具体公式也不需要临床医师充分了解,因为可以利用强大的 SPSS 软件轻松实现!SPSS 中有几种方法可以实现有序分类资料的比较。下面简单讲解下步骤。
先将数据按之前一样整理成数字导入到 SPSS 中,然后重要的步骤是要对数据进行加权转换。点击数据→加权个案,然后选择人数一栏的变量拖到右边。接下来就可以进行统计分析了,还是选择之前用的分析菜单中的「交叉表格」,选择卡方检验,即可输出计算结果。除交叉表格外,也可采用非参数检验中的「2 个独立样本」进行检验。
统计分析常见误区
1. 用卡方检验比较有序分类资料:这是最常见的错误。应该采用秩和检验,或对数据进行加权后再用卡方检验。
2. 两两比较方法不当或未调整检验水平(α):当采用秩和检验后结果认为各总体分布不同或不全相同时,需进一步做两两比较的秩和检验,以推断哪两个总体分布不同。方法之一是用 Wilcoxon 秩和检验,但检验水平要做调整,α’=α/k。k 为比较次数。以减少犯第一类错误的概率。
总结
综上,有序分类资料和等级资料是特殊的分类资料,各分类之间存在大小或顺序差别。有序多分类资料的比较应该运用秩和检验。实际操作中 SPSS 有多种方法可以实现有序多分类资料的比较,本文介绍了对数据进行加权的方法,然后再用交叉表格或非参数检验。这样可以纳入资料「有序」的信息,使结果更科学。
下期推文将介绍临床研究中常用的生存分析,敬请期待!
【参考文献】
SPSS 对有序分类资料的统计分析方法. 现代预防医学杂志 2013;40(16):2972-8
更多干货内容,关注百特围术期微信公众号了解!