欢迎大家来到IT世界,在知识的湖畔探索吧!
作者/风仕
欢迎大家来到IT世界,在知识的湖畔探索吧!
在上一期,我们已经讲完了单因素生存曲线比较 (Kaplan-Meier法),这期开始讲多因素生存分析 (Cox回归分析),我们主要从多因素生存分析 (Cox回归分析)介绍、使用条件及案例的SPSS操作演示这几方面进行讲解。
多因素生存分析介绍
Cox回归,又称Cox比例风险模型,是一种半参数回归模型,该模型不需要对生存分析的分布进行假设(类似于非参数),可以生存结局为因变量,分析众多因素对生存结局的影响。Cox回归分析主要探讨终点事件发生速度相关的因素,到底哪部分人的“死亡”速度更快以及什么因素影响了“死亡”速度。Cox回归适用于生存资料。生存数据资料存在删失数据,且时间变量t通常不满足正态分布和方差齐性的要求,因此无法使用线性回归分析及logistic回归分析。
K-M法只能研究一个因素对生存时间的影响,当对生存时间的影响因素有多个便无能为力,而Cox比例风险模型则可以估计多个研究因素对风险率的影响,其过程称为Cox回归(Cox Regression ) 。
Cox依时协变量是Cox比例模型的进一步发展。当所研究的危险因素其取值随时间而不断变化,或者其作用强度随时间而不断变化时,Cox模型的适用条件被违反,此时需要对模型加以修正,就必须用到这个过程。举一个典型的例子,临床试验随访资料中经常碰到某研究对象从安慰剂组退出,跳转至治疗组的资料就应当用此过程来分析。
多因素生存分析使用条件
1.等比例风险假设 (PH Hypothesis):这是Cox回归模型的核心假设,要求在研究期间内,某因素对生存的影响在任何时间都是相同的,不随时间的变化而变化。如果违反这一假设,模型的结果可能不准确。
2.无信息删失:在生存分析中,数据删失较为常见,如研究结束时某些参与者尚未发生事件。但Cox回归模型要求被删失的数据并不会使分析结果产生偏差,删失的出现应该与事件发生是无关的,此时即为满足无信息删失。
3.无时间依赖性协变量:指模型中的协变量(如年龄、治疗方法等)对生存风险的影响在整个研究期间是恒定的,即这些影响不随着时间的推移而发生变化。若协变量的效应随时间变化,协变量与时间的交互作用可用来判断这一影响,同时可引入时间依赖性协变量或建立分段Cox回归模型等专门处理时间依赖的模型。
这些条件确保了Cox回归分析的有效性和结果的可信度,帮助研究者正确地解释和应用研究结果。
案例的SPSS操作演示
分析示例
30例膀胱肿瘤患者的随访记录见表,试进行膀胱肿瘤患者生存情况的影响因素分析。
数据录入
1. 变量视图
名称 id 类型 数值
名称 age 类型 数值
名称 grade 类型 数值
名称 size 类型 数值
名称 relapse 类型 数值
名称 start 类型 日期
名称 end 类型 日期
名称 status 类型 数值
下图是对变量start 和 end 中对类型进行设定,因为为“日期”类型,该图为日期对话框,可 见,日期的输入格式有多种,我们需要选择与原始记录相同的格式,这样有利于输入,本例选中 mm/dd/yyyy, 若1996年2月10日,则输入为02/10/1996。
2.数据视图(部分)
操作流程
1.这是对原始数据的预处理,stepl 选用使用日期和时间进行计算,因为我们需要获得新 变量生存时间,其值等于结束时间-开始时间。
2.接着进行原始数据的预处理,准备进行计算。
3. 继续进行原始数据的预处理,设定形成的新变量为end-start, 并且单位为月,计算结果 保留小数部分,这样会使结果更加精确。
4.最后对新生成的变量进行定义,其结果变量名称为month,变量标签为生存月数。
5.这是Cox回归的主对话框,因变量为生存月数 month,也就是刚才预处理后新生成的变量,同样需要对终点事件进行定义,即定义事件。协变量框选入各类自变量,此处选入变量age, grade,size,relapse四个变量。方法(M) 选择向前条件法,相当于统计书介绍的逐步回归法。如果自变量较少,也可以采用进入(enter) 法,即将协变量框中的所有自变量强行纳入模型。
6. 按主对话框中的定义事件(F) 进入,即定义研究感兴趣的事件,本例中1代表死亡,0
代表失访。
7.下图选用exp(B)95%, 即 RR值95%的可信区间。
RR值为相对危险度(relative ratio),适合于队列研究(前瞻性研究),是队列研究中暴露组的发病率与非暴露组的发病率之比。
结果解释
1.下表给出了终点事件为27例,删失为3例,总计30例,并给出了各自百分比。
2. 块0:起始块
开始进行模型拟合,不过方程只纳入了常数项,因此四个自变量均不在方程中,若将这些 方程外的变量分别引入方程中,从而计算出相应的x²值和P值,可见 grade,size 和relapse 这 三个变量P值均<0.05,可见,在后面的模型拟合中,可以考虑将这三个变量纳入模型当中。
3. 块1:方法=向前逐步(条件LR)
(1)该模型是按照向前逐步中的条件LR 法进行拟合,模型拟合分两步:第一步模型纳入变量grade, 第二步纳入 size, 第三步纳入relapse。对于逐步拟合的过程,我们只需要看最后一 步即可,本例则看步骤3,该表是对模型中是否所有的协变量回归系数(常数项除外)全为0进行统计学检验,整体得分为33.981,自由度为3,P<0.01。从上一步开始更改是指步骤2纳入了grade 和 size, 而步骤3中引入了relapse, 这样统计学检验x² 值为4.624,P=0.032<0.05;
从上一块是指从模型仅含有常数项,现在引入了三个自变量的统计学检验,x² 值为34.421,P <0.01。说明步骤3的方程从整体上、与步骤2比较和与块0比较均有统计学意义。
(2)下表是最重要的一个表格,各指标分别为各因子的回归系数估计值(B) 、回归系数估计值的标准误(SE)、回归系数估计值的Wald 检验统计量值(Wald) 、自由度(df)、显著性水平 即 P 值(Sig.) 、各因子的相对危险度RR 值(Exp(B)) 、RR值的95%可信区间。
①这里也只看步骤3,可以得出风险函数的表达式为:
h(t)=h₀(t)exp(1.680×grade +1.078×size +0.979×relapse)表达式右边变量的线性组合值越大,则风险函数h(t) 越大,预后越差,故称为预后指数 (prognostic index,PI),如1号患者grade =1,size =0,replaspe =0,则预后指数为PI=1.680×1+1.078×0+0.979×0=1.680;3号患者grade=2,size =1,replaspe =1,则预后指数为PI= 1.680×2+1.078×0+0.979×1=4.339,可以估计3号患者的预后要比1号患者差。可按预 后指数将观察对象分成若干组,如低危组、中危组和高危组,对制订合理的治疗方案,正确指导 患者的治疗,提高生存率有指导意义。
②从RR 值可以看出,若变量肿瘤分级grade 越严重,则预后越差,大约指数每上升1分, 则死亡危险是以前的5.368倍;若变量肿瘤大小size越大,则预后越差,大约指数每上升1分,则死亡危险是原来的2.939倍;若肿瘤复发,则预后越差,死亡危险是未复发的2.662倍。
(3)该表显示各步骤中未纳入方程的自变量检验结果,可见步骤1中变量 size和relapse 的P 值分别为0.009和0.016,考虑将age引入方程;而步骤2中变量age的P值为0.115,P> 0.05,不考虑引入模型;而 relapse的 P 值为0.029,考虑引入模型;步骤3中age的 P>0.05, 表明模型无需引入变量,模型拟合过程结束。
(4)下表也是对模型拟合程度的一个检验,如步骤1,若删除了引入的变量grade,则 P<0.01,说明引入该变量有意义;而步骤2中,若删除引入的变量grade, 则P<0.01, 若删除引入的变量size, 则P=0.010<0.05, 说明引入这两个变量均有意义;步骤3中,若分别删除变量 grade、size和 relapse,P均<0.05,说明引入这三个变量均有意义。这只是一个参考表格,不必重视。
(5)下表给出了各自变量的平均值,该表也不太重要。
参考:《临床医学研究中的统计分析和图形表达实例详解》
欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/145207.html