内容简介
SPSS(Statistical Product and Service Solutions,统计产品和服务解决方案)是当今世界著名的统计软件之一,具有界面友好,统计功能强大,前后处理功能完善等优点。本书基于新版本SPSS 21.0,结合统计教学的特点,应用大量的案例,分七篇18章阐述了SPSS的常用统计分析方法以及在社会学、管理学、经济学、教育学、医学、工业生产等方面的应用。本书内容翔实、语言简练、思路清晰、图文并茂、深入浅出、理论与实际设计相结合,通过大量的案例对SPSS 进行了比较全面的介绍。
本书适合高等院校相关专业的本科生、研究生,以及在各领域从事统计分析和决策的人员学习参考。
目录
第1篇 SPSS统计分析界面操作介绍
第1章 SPSS基本统计分析操作介绍 2
第2章 SPSS高级统计分析操作介绍 85
第2篇 SPSS在社会学中的应用
第3章 SPSS在居民收入和消费
分析中的应用 112
第4章 SPSS在电视广告收视与
收益分析中的应用 134
第5章 SPSS在智商测试和开发
分析中的应用 155
第3篇 SPSS在管理学中的应用
第6章 SPSS在企业人力资源
管理中的应用 168
第7章 SPSS在商品营销管理
分析中的应用 190
第4篇 SPSS在经济学中的应用
第8章 SPSS在地区经济发展水平
分析中的应用 218
第9章 SPSS在房地产交易
分析中的应用 232
第10章 SPSS在企业经济效益
评价中的应用 251
第5篇 SPSS在教育学中的应用
第11章 SPSS在研究生招生
分析中的应用 278
第12章 SPSS在教学方法与学生成绩
分析中的应用 302
第6篇 SPSS在医学中的应用
第13章 SPSS在儿童生长发育
研究中的应用 332
第14章 SPSS在癌症生存诊疗
分析中的应用 354
第15章 SPSS在病毒培养和病症
分析中的应用 374
第7篇 SPSS在工业生产中的应用
第16章 SPSS在饮料成分鉴别
分析中的应用 390
第17章 SPSS在产品生产控制
分析中的应用 407
第18章 SPSS在矿产资源勘探
分析中的应用 425
精彩书摘
第2章 SPSS高级统计分析操作介绍
在上一章中详细介绍了SPSS基本统计分析方法的界面操作和英文标签说明,包括数据描述性分析、均值检验、方差分析、相关回归分析、非参数检验、聚类和判别分析、主成分分析和因子分析等。在本章中,将详细介绍SPSS软件中所用到的高级统计分析方法,主要包括生存分析、信度分析以及常用统计图形的界面操作和英文标签说明。
2.1 生 存 分 析
生存分析方法是一种非常重要的统计分析方法,主要用于分析涉及一定时间的发生和持续长度的时间数据,用以揭示事件发生和发展的规律。生存分析是近一二十年来发展起来的数理统计新分支,它是根据现代医学、工程等科学研究的大量实际问题提出来的,着重对截断数据进行统计分析研究。生存分析的理论与应用受到了世界各国,特别是发达国家很大的重视。1986 年美国国家科学院委员会提出的数学发展概况中,曾把生存分析列为?6?大发展方向之一。
生存分析目前已广泛应用在医学、生物学、公共健康、金融学、保险、人口统计等诸多领域,它涉及数理统计中原有的参数统计与非参数统计的结合,而且涉及一些较深较新的概率和其他数学工具。因此,生存分析方法日益受到人们的重视。
本章介绍了如何使用SPSS来进行生存分析。SPSS所提供的功能主要有以下4项。
* Life Tables:寿命表分析。
* Kaplan-Meier:Kaplan-Meier分析。
* Cox Regression:Cox回归分析。
* Cox w/Time-Dep Cov:时间相依性的回归分析。
2.1.1 生存分析简介
生存分析(Survival Analysis)主要用于对涉及一定时间的发生和持续长度的时间数据的分析。生存分析所分析的数据通常称为生存数据,生存数据按照观察数据所提供的信息的不同,可以分为完全数据、删失数据和截尾数据3种。
生存分析(Survival Analysis)是目前统计学的热门,自20世纪70年代中期以来,得到了迅速的发展,无论在理论或应用方面都受到了人们的重视。生存分析不仅能妥善处理现实生活中常见的截尾数据(Censored Data)问题,而且在解决实际问题的同时,揭示了一些更为复杂的理论问题,促进了数理统计理论的发展。1986 年美国国家科学院委员会提出的数学发展概况的报告中,6个有代表性的分支学科中就有一个是论述生存分析的,而且被作为数学与其他学科,甚至社会科学互相渗透的一个重要例子。
生存分析所要分析的数据称为生存数据,用于度量某事件发生前所经历的时间长度。事件可以是产品的失效、保单的索赔、疾病的发生、生命的死亡等。若跟产品失效有关,生存数据也称为失效数据。
按照观察数据所提供的信息的不同,生存数据又可以分为以下三大类。
1.完全数据
完全数据指的就是提供了完整信息的数据,比如研究某种产品的失效时间,如果有一个样品从进入研究直到失效都在我们的观察之中,就可以得到其失效的具体时间,那么这个失效数据就是一个完全数据。
2.删失数据
生存分析经常研究在不同的时间点或时期被研究的事件发生的概率,而研究的周期可能很长,比如在医学领域,研究某种慢性疾病的治疗效果一般都要对患者进行长期随访,统计一定时期后的生存或死亡的情况以判断治疗效果,这种随访数据就是生存数据。但是,由于获得数据的时间很长,中间可能患者由于迁移、不愿意继续合作等各种原因退出了随访,或者研究单位由于人力、物力、财力等方面的原因在某个时刻决定中止随访,那么这些退出研究或者被终止研究的患者提供的信息就是不完整的信息,若他们在退出研究之时仍然存活,那么日后的确切死亡时间在数据中就无法反映。
完全数据和删失数据都是在生存分析中经常会碰到的数据,SPSS要求在进行生存分析时每个变量都必须再设置一个相应的示性函数,用以说明这个数据到底是完全数据还是删失数据。通常采用的示性函数的取值规则是:完全函数,示性函数取值为0;删失数据,示性函数取值为1。
3.截尾数据
截尾数据和删失数据一样,所提供的是不完整的数据,它和删失数据的不同在于,它提供的是跟时间有关的条件信息。比如保险公司想研究60岁以上的老年人投保了意外伤害险的人发生意外的概率,那么被研究的投保人在研究期内所提供的生存数据为截尾数据,因为它们都附带一个时间条件:进入研究的人的年龄都应该大于等于60岁。
不过SPSS软件只考虑对完整数据和删失数据的分析,对截尾数据不提供专门的分析方法。
2.1.2 寿命表分析
在生存分析中,对生存函数的估计是一个重要问题。寿命表方法是一种重要的非参数估计方法,它不仅有悠久的历史,而且在各领域都有广泛的应用。
在实际研究中,通常需要了解两个事件之间间隔的时间长短的分布。例如,如果正在研究治疗某种致命疾病的效果,可能要观察治疗实施到患者死亡这段时间的情况。得到评估结果的时候,若并非所有患者都死亡,则必须将死亡患者和仍然活着的患者的生存时间合并到分析中。又如,检验一部分人婚姻持续的时间,必须包括婚姻正在延续和婚姻已经终止两种时间长度。从各保险表中,可以分析在一个特定时间点上生存患者的比例和婚姻持续的比例。总的来说,这样的一些事件被称为截断观测。此时,使用传统的方法来分析这种观测不再适合。
寿命表分析正好适合于分析这种数据。寿命表的基本思想是将观测区间划分为很多小的时间区间。对于每一个区间,所有的在该区间依然“存活”的观测个案都会被用来计算在此区间“死亡”的概率。对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率。
建立或打开数据文件后,即可进行寿命表分析。
选择菜单栏中的“分析”→“生存函数”→“寿命表”命令,即可弹出如图2.1.1所示的“寿命表”对话框。
在该对话框的左侧为源变量框,右侧的“时间”列表框用于在左侧的源变量框中选择生存时间变量。
在“显示时间间隔”选项组中设置时间区间的长度及终点。寿命表分析以时间0为第一个时间区间的起点。用户在前面的数值框中输入最后一个区间的终点值,在“步长”数值框中输入区间长度。
“状态”列表框用于选入状态变量进入。选入状态变量后,“定义事件”按钮被激活,单击该按钮,即可弹出如图2.1.2所示的“寿命表:为状态变量定义事件”对话框。
图2.1.1 “寿命表”对话框
图2.1.2 “寿命表:为状态变量定义事件”对话框
在“寿命表:为状态变量定义事件”对话框中有两个选项:“单值”选项,在该选项的数值框中设置一个指示事件发生的数值。在输入这个值之后,带有其他值的观测都被作为截断观测;“值的范围”选项,在该选项的数值框中设置一个指示事件发生的数值区间。在数值框中输入区间的上下界,观测值不在这个区间的观测都被作为截断观测。
设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
“因子”列表框用于从左侧的源变量框中选入一阶因素变量。选入变量后,“定义范围”按钮被激活,单击该按钮,即可打开“有效表格:定义因子范围”对话框,如图2.1.3所示。
在“有效表格:定义因子范围”对话框中有两个选项:“最小值”数值框中的数值用于设置因素变量的下界;“最大”数值框中输入的数值用于设置因素变量的上界。设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
“按因子”列表框用于选入二阶因素变量。选入变量后,“定义范围”按钮被激活,单击该按钮,即可打开如图2.1.3所示的“有效表格:定义因子范围”对话框,用于设置第二因素变量取值的上下限,设置方法同上。设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
在“寿命表”对话框中单击“选项”按钮,即可弹出“寿命表:选项”对话框,如图2.1.4所示。
图2.1.3 “有效表格:定义因子范围”对话框
图2.1.4 “寿命表:选项”对话框
“寿命表”选项:用于选择是否输出生命表。
“图”选项组用于选择所输出的函数图形。
* “生存函数”选项:如果选中此选项,则会输出以线性刻度生成的累积生存函数。
* “危险函数”选项:如果选中此选项,则会输出以线性刻度生成的累积危险函数。
* “1减去生存函数”选项:如果选中此选项,则会输出(1-累积生存函数)。
* “取生存函数的对数”选项:如果选中此选项,则会输出以对数刻度生成的累积生存函数。
* “密度”选项:如果选中此选项,则会输出密度函数。
“比较第一个因子的水平”选项组用于选择比较不同水平的一阶因素变量的方法。
* “无”选项:表示不进行子群之间的比较。
* “整体比较”选项:表示同时比较所有水平的一阶因素变量。
* “两两比较”选项:表示配对比较一阶因素变量水平。
设置结束后,单击“继续”按钮确认选择并返回到“寿命表”对话框。
所有设置结束后,单击“确定”按钮,执行生命表分析。
……
前言/序言
在当今信息化时代的背景下,大量的数据和信息充斥着人们生活的各个层面,无论是政府、企业还是个人,要在大量的信息中获得有科学价值的信息,都必须具有对采集的信息进行存储、整理、统计分析的能力,以做出科学的评估和决策。因此,对信息的采集、存储、整理、统计分析便显得尤为重要,而SPSS正是一款为此而设计的统计分析软件。
SPSS(Statistical Product and Service Solutions)是当今世界著名的统计分析软件之一。SPSS使用的是典型的图形用户界面,直接用鼠标进行操作就可以实现大部分功能,界面非常友好且操作简便、快捷。SPSS?兼容多种格式的文件,可以直接在电子表格中输入数据,也可以从文本文件或数据库文件中导入数据。对于导入到数据编辑器中的数据,可以进行聚合、拆分、选取、重构、转置等编辑工作。
SPSS 21.0提供了常见的统计分析功能,如描述性统计分析、探索分析、列联表分析、均值比较与检验、方差分析、回归分析、相关分析、因子分析等,也提供了信度分析、生存分析、多元方差分析等比较高级和专业的统计分析功能。同时SPSS Statistics 21.0还采用了AMOS软件进行数据方面的分析。在AMOS 环境下,读者可以在直观的路径图下指定、估计、评估以及设定模型,以展示假定的各变量之间的关系,来方便建立能真实反应复杂关系的行为态度模型。
相对于同类介绍SPSS 21.0的书籍来说,本书具有几个鲜明的特点。首先,本书的每一章采用了案例进行讲解,从而在对案例进行实际演练操作的过程中达到巩固知识的效果。其次,本书还设置了本章小结、案例描述等内容,使读者可以更好地应用SPSS软件。再次,本书还采用了图形生成器生成的更加清晰、种类多样的图形,使得SPSS 21.0的操作界面说明更加简洁明了,从而增加了本书的趣味性。
本书案例涉及社会学、管理学、经济学、教育学、医学等多个方面的应用,并对操作结果都有详细的分析,便于读者在实际操作中对照修正。
本书各章内容大致如下。
第1章为SPSS基本统计界面操作说明部分,介绍了SPSS 21.0主要的一些基本统计分析的界面布置和各标签方法的具体含义。
第2章为SPSS高级统计界面操作说明部分,主要介绍了生存分析、信度分析、时间序列分析和各种统计图形的绘制。
第3章介绍了SPSS在居民收入和消费分析中的应用。
第4章介绍了SPSS在电视广告收视和收益分析中的应用。
第5章介绍了SPSS在智商测试和开发分析中的应用。
第6章介绍了SPSS在企业人力资源管理和公司员工招聘方面的应用。
第7章介绍了SPSS在商品营销管理分析中的应用。
第8章介绍了SPSS在地区经济发展水平分析中的应用。
第9章介绍了SPSS在房地产交易和房产抵押分析中的应用。
第10章介绍了SPSS在企业经济效益评价中的应用。
第11章介绍了SPSS在研究生招生录取中的应用。
第12章介绍了SPSS在教学方法与学生成绩分析中的应用。
第13章介绍了SPSS在儿童生长发育研究中的应用。
第14章介绍了SPSS在癌症生存诊疗分析中的应用。
第15章介绍了SPSS在病毒培养和病症分析中的应用。
第16章介绍了SPSS在饮料成分鉴别分析中的应用。
第17章介绍了SPSS在产品生产控制分析中的应用。
第18章介绍SPSS在矿产资源勘探分析中的应用。
本书由华北理工大学的张慈、薛晓光、王大永老师编著,参编的人员还有张婷、封超、陈艳华、代小华、刘宝成等,在此一并向他们表示感谢。由于编者水平有限,加上时间仓促,书中难免有一些不足之处,欢迎同行和读者批评指正。
编 者
SPSS 21.0行业统计分析与应用 下载 mobi epub pdf txt 电子书 格式