首页/文章/ 详情

检验数据正态性分布在SPSS中的K-S和S-W检验

7月前浏览1386

摘要

文章强调了正态分布的统计重要性,并介绍了SPSS软件在数据分析中的应用。详细讨论了K-S检验和S-W检验在不同样本大小下的适用性,指出在小样本数据中更倾向于S-W检验结果,在大样本数据中更倾向于K-S检验结果。同时,提醒读者在实际应用中应综合考虑多种方法来判断数据的正态性,而不应只依赖单一的统计指标。


正文

个人认为:不做分析的检验数据就没有灵魂。

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

SPSS(Statistical Package for the Social Sciences)社会科学统计软件包,操作界面简洁友好,输出结果美观。SPSS采用类似EXCEL表格的方式输入与数据管理,数据接口通用性强,能方便的读取其他数据库。

Ⅰ.柯尔莫戈洛夫-斯米诺夫检验(Kolmogorov-Smirnov test),简称K-S检验;

Ⅱ.夏皮洛-威尔克检验(Shapiro—Wilk test),简称S-W检验。
大部分时候,这两种方法得到的检验结果大体相同,以致于很多人都忽视了这两种检验方法的区别。但在进行数据的正态性检验的时候,我们有必要对这两种方法有基本的了解,使我们得出的分析结论更科学、更有说服力,更有的放矢。
利用SPSS进行K-S和S-W检验
(注意需要在因变量列表放入你要检验的变量)
同时输出k-s 检验和S-W检验的结果:
结果如下:


一般情况下原假设为不符合正态分布假定;备择假设(alternative hypothesis,是统计学的基本概念之一,其包含关于总体分布的一切使原假设不成立的命题。备择假设亦称对立假设、备选假设)为符合正态分布假定。因sig>显著性水平α时拒绝原假设,认为原数据符合正态分布性假定。
1.当分析小于50行的小样本数据时,我们倾向于看S-W检验得到的正态性检验结果;
例:
首先我在SPSS中导入一组30行的检验数,并对这组随机数进行了正态性检验,得到的正态性检验结果如下图所示:使用K-S检验得到的显著性检验P值=0.024,小于0.05,表明这组数据不满足正态分布;而使用S-W检验得到的显著性检验P值=0.054,大于0.05,表明这组数据满足正态分布。此时,我们应该倾向于接受哪种检验方法得出的结论呢?我们注意到这组数据仅30行(自由度),是一个小样本数据,如果数据量在3-50之间,我们倾向于看S-W检验的结果,因此,这个案例中我们更倾向于认为这份数据满足正态分布。

2.当分析大于50行的大样本数据时,我们倾向于看K-S检验得到的正态性检验结果;

3.当数据量大于5000行时,SPSS只会显示K-S检验这一种检验方法。

4.正态分布的检验方法包括图示法、偏度和峰度、非参数检验方法。

5.实际用不能太刻意追求偏峰度的Z值和S-W及K-S检验的P值,需要结合直方图、P-P图和Q-Q图来判断。


来源:压力容器工程师
通用
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-04-27
最近编辑:7月前
君雔
本科 | 高级工程师 压力容器工程师
获赞 57粉丝 27文章 116课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈