欢迎大家来到IT世界,在知识的湖畔探索吧!
“回归”这个词源于英国科学家弗朗西斯·高尔顿爵士(Sir Francis Galton,1822年2月16日-1911年1月17日)的一项研究,高尔顿发现高个子父亲的儿子身高会矮一些,而矮个子父亲的儿子身高会高一些(否则高个子家族会越来越高,而矮个子家族会越来越矮),也就是说人类的身高都会回到平均值附近,他将这种现象称为均值回归。
高尔顿首先对一些父子的身高进行了抽样统计,得到一组数据集(父亲身高X,儿子身高Y),然后根据数据集拟合出一条直线(即Y=ax+b),最后运用该直线就可以通过某父亲的身高预测儿子的身高,下面用一个例子举例。
对数据进行简单线性回归分析常按照以下步骤进行:
现研究某医院儿科住院天数和住院总费用的关系,住院费用为因变量,住院天数为自变量,共计429条数据。

欢迎大家来到IT世界,在知识的湖畔探索吧!
2.判断有无异常值
判断方法:⑴通过绘制散点图直观观察;⑵亦可通过SPSS线性回归的【统计】→【个案诊断】→【所有个案】进行分析,若标准残差超过[-3,3],则可视为异常值。
我们使用第二种方法进行分析。
Step1【分析】→【回归】→【线性】
Step2【统计】→【个案诊断】→【所有个案】
结果展示
3.判断数据是否满足简单线性回归假设条件
⑴线性(linear) 因变量与自变量呈线性关系,通过绘制散点图判断;
Step1【图形】→【旧对话框】→【散点/点状】→【简单分布】→【定义】
结果展示
⑵独立性(independent) 任意两个观察值之间相互独立,通过线性回归的【统计】→【德宾-沃森】进行分析,一般来说Durbin-Waston检验值分布在0-4之间,越接近2,观察值相互独立的可能性越大。
Step1【分析】→【回归】→【线性】
Step2【统计】→【德宾-沃森】
⑶正态性(normal) 随机误差近似正态性,可通过直方图或者P-P图判断残差是否符合正态分布;
Step1【分析】→【回归】→【线性】
Step2【绘图】→【直方图】、【正态概率图】
结果近似正态性
⑷方差齐性(equal variance) 残差满足方差齐性
Step1【分析】→【回归】→【线性】
Step2【绘图】→将ZRESID(标准化残差)选入Y轴,将ZPRED(标准化预测值)选入X轴→勾选“产生所有部分图”,即可得到残差随着估计值的变化趋势,若所有点均匀分布于直线Y=0的两侧,则可认为方差齐性。
结果展示
结果:方差齐
4.估计回归模型参数,建立模型
Step1【分析】→【回归】→【线性】
Step2 选择因变量和自变量,【统计】选项卡中“回归系数”选择“估计”,选择“模型拟合度”,单击“继续”,单击“确定”。
结果展示
回归模型:Y=312.874X+899.308
该表格展示了自变量对因变量的解释程度,即模型拟合程度,可用R^2(决定系数)来衡量。决定系数取值在0-1之间,R^2越大模型拟合程度越高。本案例中R^2=0.800,即住院天数对住院总费用的解释程度为80%,解释程度很高。
5.对模型进行假设检验
对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。
方差分析结果:F=758.070,p<0.05,说明模型Y=312.874X+899.308具有统计学意义。
t检验结果:回归系数和常数项的p值均小于0.05,具有统计学意义。
至此,一简单模型的线性回归分析就完成了,各位学会了么?
该文章经paper YY查重,查重率42%。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/124735.html