编辑推荐
(1) 将JMP中的DOE实验设计作为书中一章,重点介绍各种实验设计方法的应用与不同,并补充了DOE中缺少的正交设计方法的应用; (2) 书中讲解的每种统计分析方法实例分析都运用SAS与JMP两款软件进行分析并比较两种软件统计输出内容的异同及使用方法上的优劣,方便读者比较和借鉴; (3) 书中重点介绍了SAS软件在多因素且存在交互作用的方差分析上的优势及结论判断依据,同时介绍协变量在协方差分析中的重要作用; (4) 在优选回归模型中重点介绍运用SAS软件所提供的多种回归方法进行多变量筛选、多变量的共线性诊断、优选*佳回归模型的判断准则。
内容简介
《SAS统计分析及应用与JMP实验设计(第2版)》主要介绍JMP的DOE试验设计和SAS与JMP两个软件包的多元统计分析方法。全书重点在于用实例讲解运用SAS与JMP两个软件包中的各种统计分析方法,并详细解释输出结果的统计学意义,比较两个软件相同统计方法的优劣与输出内容的异同,方便学习者从多角度应用,能够举一反三,学会选用科学合理的技能判断并获取科学的、有价值的统计分析结果,提高效率。 全书共9章,第1章介绍SAS与JMP软件基本操作;第2章和第3章介绍常用描述统计量、数据分布、正态性检验、t检验与非参数检验等概念;第4章重点讲解JMP的DOE实验设计,包括: 定制设计、筛选设计、完全析因设计、响应面设计、田口设计,补充介绍正交设计;第5章结合第4章实验设计,注重从多角度讲解方差分析应用;第6章重点介绍回归分析的多变量筛选、曲线直线化回归、共线性诊断、非线性回归、Logistic回归及相关分析;第7~9章介绍聚类分析、主成分分析和因子分析。 本书可作为高校研究生、本科生的统计学教材,尤其适合非数理统计专业的研究人员作为数据分析的参考资料。
内页插图
目录
第1章SAS及JMP系统概述11.1SAS及JMP系统简介11.2JMP系统界面操作21.2.1JMP安装、启动与退出21.2.2JMP系统设置及中英文切换21.2.3JMP与SAS数据文件管理41.2.4JMP功能简介71.3SAS系统概述及界面操作指南91.3.1SAS的启动与退出101.3.2修改SAS系统的SASV8.CFG111.3.3SAS系统主要窗口简介121.4SAS数据集及SAS的文件管理151.4.1SAS数据集、逻辑库及程序文件151.4.2建立并调用SAS数据集171.4.3导出SAS数据集为Excel文件221.4.4数据集排序241.5SAS的数据步与过程步简介241.5.1SAS程序书写规范和运行方法251.5.2利用DATA步对已有数据集扩增新变量261.5.3DATA步中常用函数281.5.4SAS过程步及常用语句简介31第2章常用统计学概念简介362.1统计学概述362.1.1统计学历史概述362.1.2描述统计简介362.2统计量的抽样分布382.2.1概率和随机变量392.2.2二项分布402.2.3泊松分布432.2.4正态分布442.2.5t分布462.2.6F分布472.2.7χ2分布482.3统计假设检验492.3.1统计假设检验简介492.3.2t检验522.3.3F检验522.3.4χ2检验52习题53第3章t检验与非参数检验543.1t检验及应用543.1.1t检验适用条件及判断准则543.1.2UNIVARIATE过程及正态性检验563.1.3配对样本均值比较及正态性检验应用实例583.1.4TTEST过程及两组独立样本均值比较683.1.5SAS与JMP两种软件t检验方法总结793.2非参数检验及应用793.2.1Kruskal�瞁allis检验803.2.2NPAR1WAY过程(非参数检验过程)813.2.3NPAR1WAY过程举例说明823.2.4利用JMP进行非参数检验903.3FREQ过程及应用实例(频数分析)933.3.1卡方检验的基本思想933.3.2FREQ过程963.3.3FREQ过程及JMP频数分析应用实例98习题106第4章JMP DOE实验设计1094.1完全析因设计1094.1.1单因素多水平完全析因设计1104.1.2多因素多水平完全析因设计1114.2定制设计1144.3筛选设计1184.4响应面设计1224.5混料实验设计1254.6田口设计1294.6.1田口设计简介1294.6.2田口设计实例说明1294.7正交设计1354.7.1正交设计的概念和正交表的初步认识1354.7.2含交互作用的正交设计1374.7.3正交设计实例说明139习题146第5章方差分析1485.1方差分析简介1485.1.1方差分析基本概念1485.1.2方差的同质性检验1515.1.3方差分析的基本假定和数据转换1535.2ANOVA过程和GLM过程简介1555.2.1ANOVA过程1555.2.2GLM过程1595.3完全随机设计方差分析1685.3.1完全随机设计——单因素K水平多重比较1685.3.2完全随机设计——多因素K水平多重比较1795.4析因设计及CONTRAST语句使用说明2075.4.1CONTRAST语句说明2075.4.2实例说明2095.5二次响应面设计的方差分析2195.6正交设计实例说明2385.7拉丁方设计及其统计分析2475.7.1拉丁方设计及其线性模型2475.7.2拉丁方设计应用实例2485.8协方差分析2595.8.1协方差分析简介2595.8.2协方差分析的数学模型及基本假定2615.8.3协方差分析应用举例262习题277第6章相关与回归分析2826.1相关与回归分析概述2826.1.1相关与回归分析的概念与区别2826.1.2直线回归与相关分析2846.2相关、回归过程说明2866.2.1CORR相关过程2866.2.2PLOT过程2876.2.3REG回归过程2896.2.4回归模型的共线性诊断及强影响点诊断2946.3线性及曲线直线化回归模型2956.3.1简单线性回归方程2956.3.2线性回归方程应用举例2976.3.3二次项直线化表示的回归方程3006.3.4用JMP进行模型拟合3076.4可直线化的曲线拟合3146.4.1曲线拟合说明3146.4.2曲线直线化应用举例3156.4.3确定*佳模型的标准3206.5RSREG过程3346.5.1RSREG过程说明3346.5.2二次响应曲面RSREG过程举例说明3376.6非线性回归过程3596.6.1NLIN过程简介3596.6.2NLIN应用举例3616.7Logistic回归3716.7.1Logistic回归概述3716.7.2Logistic回归过程3726.7.3用SAS进行Logistic回归应用实例3746.7.4用JMP进行Logistic回归应用实例379习题381第7章聚类分析3867.1聚类分析概述3867.2TREE过程3877.3VARCLUS过程及应用举例(对变量聚类)3887.3.1用VARCLUS过程实现变量聚类分析3887.3.2VARCLUS过程应用实例3897.4CLUSTER过程及实例分析(对样本聚类)3977.4.1CLUSTER过程3977.4.2CLUSTER过程应用实例3997.5JMP的聚类分析403习题404第8章主成分分析4088.1主成分的几何意义及数学模型4088.2PRINCOMP过程4128.3主成分分析应用举例414习题422第9章因子分析4259.1因子分析基础4259.2PROC FACTOR过程4279.3因子分析应用举例4319.4主成分与因子分析综合实例说明4349.5用JMP进行主成分和因子分析440习题444参考文献447
精彩书摘
第5章方差分析第5章方 差 分 析 本章学习目标 �r 学习并掌握方差分析概念,进行方差分析的基本条件。 �r 学习并掌握利用SAS和JMP进行单因素方差分析的方法,理解输出统计量的意义及判断依据。 �r 学习并掌握利用SAS进行多因素方差分析的方法,理解方差分析输出统计量的意义及判断依据。 �r 学习并掌握利用SAS进行协方差分析的方法,理解协方差分析输出统计量的意义及判断依据。 5.1方差分析简介[��4/5]5.1.1方差分析基本概念方差分析是数理统计学中常用的数据分析方法之一,它是分析实验数据各因素各水平对某事物某指标的影响是否有显著差异的一种统计分析方法。根据实验考虑的因素个数及是否有协变量参与作用,可分为单因素、双因素、多因素方差分析及协方差分析。在方差分析中,经常把实验数据的总方差分解为由所考察因素引起的主因素方差、因素间的交互作用引起的交互因素方差和随机因素引起的随机误差方差。当影响因素是定性变量(一般称为分组变量或效应变量),观测结果是定量变量(一般称为结果变量或响应变量)时,常用的数据处理方法是: 假设响应变量均数或均值相等,从而检验响应变量受因素影响的效果是否有显著差异。 若只有一个效应变量(也称因素或因子),而且其水平数K=2,则称为单因素2水平方差分析,*常用t检验进行两两均值比较以检验对响应变量影响的效果是否产生显著差异。SAS系统的TTEST过程即可完全满足此类数据分析的需要。若实验中考虑单因素多水平,K>3,或考虑两个或两个以上因素且多水平时(k≥2),则称多因素多水平方差分析,通常用多重比较的F检验。SAS系统的ANOVA和GLM过程可完全满足多因素多水平的多重比较的需要。 F检验又叫方差齐性检验。从两个研究总体中随机抽取两组样本,要对这两组样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性,就要用F检验。F检验就是检验两组样本的方差是否有显著性差异,以确定它们的精密度是否存在差异,也就是确定两组数据之间是否存在系统误差。当不存在系统误差时,可进行t检验。正态性和方差齐性是进行方差分析的两个基本条件。 当不能满足方差齐性的条件时,至今尚未找到十分满意的处理方法,仅能采用非参数检验法进行简单分析。尽管如此,由于方差分析适用的范围比较广泛,所以,它在假设检验中起到了举足轻重的作用。因此,弄清方差分析的基本思想,有助于读者尽快学会如何用方差分析法处理各种实验设计方案下的实验数据。 方差分析的基本思想: 当实验数据满足正态性和方差相等(也称方差同质性)的假设条件时,把全部数据关于总均数的离差平方和分解成几部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应。将各部分均方(即方差)与误差均方相比较,依据F统计量做出统计推断,得到统计结论。 1. 单因素试验的方差分析 考虑一个因素A取a个水平,分析这a个不同水平对所考察的指标Y的影响,即在实验中只有A一种因素取a个水平变化,而其他因素控制不变,这样的实验叫单因素实验,所进行的方差分析叫单因素实验的方差分析。 零假设: H0: μ1=μ2=…=μa 备择假设: Ha: μi≠μj,至少有一对这样的i,j 在Ai水平下的样本均值为: i.=1ni∑nij=1xij样本数据的总平均值为: =1n∑ai=1∑nij=1xij总离差平方和为: SST=∑ai=1∑nij=1(xij-)2总离差平方和可分解为: SST=∑ai=1∑nij=1(xi.-)2+∑ai=1∑nij=1(xij-i.)2+2∑ai=1∑nij=1(i.-)(xij-i.)其中,上式中的*后一项为0。 若记: 因素A的离差平方和为: SSA=∑ai=1∑nij=1(i.-)2误差项的离差平方和为: SSe=∑ai=1∑nij=1(xij-i.)2则有: SST=SSA+SSe(总变差=组间差异+组内差异)。 SST是全部实验数据与总平均值之间的差异,称为总变差。SSA表示在Ai水平下的样本均值与总平均值之间的差异,叫因素A效应的离差平方和,也称组间差异。SSe表示在Ai水平下的样本值与该水平的样本均值之间的差异,它是由随机误差引起的,叫误差平方和,又称组内差异。 SST的自由度为n-1。因为SSA与SSe相互独立,SSA的自由度fA为a-1(a为水平数),SSe的自由度fe为n-a。fT=fA+feF=SSAfASSefe2. 双因素无交互作用的方差分析 客观现实中的事物很复杂,影响某项指标的因素往往有很多,这些因素互相联系,互相依存,互相对立,问题也变得复杂多样。当只考虑两个因素的作用,且两因素间无交互作用时,我们进行组间变差和组内变差(即误差)的变差分析,叫双因素无交互作用实验方差分析。 双因素无交互作用总离差平方和分解为: SST=∑ai=1∑bj=1(i.-)2+∑ai=1∑bj=1(.j-)2+∑ai=1∑bj=1(xij-i.-.j+)2 SST=SSA+SSB+SSeSST的自由度为ab-1。因为SSA、SSB与SSe相互独立,SSA的自由度fA为a-1(a为A因素的水平数),SSB的自由度fB为b-1(b为B因素的水平数),SSe的自由度fe为(ab-1)-(a-1)-(b-1)=(a-1)(b-1) F1=SSAfASSefeF2=SSBfBSSefe3. 双因素有交互作用的方差分析SST=SSA+SSB+SSA×B+SSe SSe=SST-SSA-SSB-SSA×B SSA=bn∑ai=1(i..-)2 SSB=an∑bj=1(.j.-)2 SSA×B=n∑ai=1∑bj=1(ij.-i..-.j.+)2 SSe=∑ai=1∑bj=1∑nk=1(xijk-ij.)2SST的自由度为abn-1。因为SSA、SSB与SSe相互独立,SSA的自由度fA为a-1(a为A因素的水平数),SSB的自由度fB为b-1(b为B因素的水平数),SSA×B的自由度fA×B为(a-1)(b-1),SSe的自由度fe为(abn-1)-(a-1)-(b-1)-(a-1)(b-1)=ab(n-1) F1=SSAfASSefeF2=SSBfBSSefeFA×B=SSA×BfA×BSSefe4. 多因素有交互作用的方差分析 方差分解 SST=SSA+SSB+SSC+SSA×B+SSA×C+SSB×C+SSA×B×C+SSe 5. 多重比较 在三个或多个均值之间做两个或多个均值比较的检验称为多重比较(Multiple Comparison Procedure)。 在引入假设概念时,曾把选择α水平与做出错误判断的风险相联系。为了理解多重比较方法,需要控制所有比较的总错判的机会(当均值相同时判断为不同的错误),也要控制每个单独比较的错判机会,因此分为实验比较错误率和比较错误率两大类,实验比较错误率MEER相对比较错误率CER更精确、更严格。 例如,有5种施肥方法,均值做两两比较共有10种组合,如要控制10种比较的总错判率在α水平,平均到每组比较的控制水平会在十分之一的α水平,这就称为控制“实验比较错误率”或称“控制对整个实验的总错判机会”,记为“实验比较错误率”(Means Experimentwise Error Rate,MEER)。 另一种,如果想对10种比较中的每一种进行单独控制比较错判机会在α水平,就称为控制“比较错误率”,或称“对每一个比较的单独错判机会”,记为“比较错误率”(Comparisonwise Error Rate,CER)。以上例为例,每一种两两比较分别进行α水平CER的控制,则10种两两比较合计则为10倍的α水平,相对MEER而言则每种比较的错判率会扩大10倍。因此在进行多重比较时,采用MEER方法进行比较会比CER方法比较要严谨得多。 在进行多重比较时,应采用两类方法进行比较,若MEER方法能够得到较好的结论,一定以MEER法的结论作为研究结论。若MEER法比较均值无显著差异,可采用CER法进行比较,可用CER法的结论作为研究结论。 对于多因素,由于多因素的影响及各因素间的交互作用相当复杂,为了获得*好的实验结论,通常优先使用MEER“实验比较错误率”作为控制准则,其次可选用CER比较错误率。 SAS软件在GLM方差分析过程中提供了多种MEER法和多种CER法,两大类中的各种方法都有其特点,选用时应分清各种方法的优势,合理使用。 ……
前言/序言
SAS统计分析及应用与JMP实验设计(第2版)前言前言 随着科学技术的进步及信息技术的发展,计算机已成为人们科研工作的重要工具。科研工作所获取的各种数据都会借助各种计算机软件帮助研究者获得*终结果,统计分析软件是重要的工具和手段。SAS软件自开发为人们使用以来,在统计分析方面一直处于权威领先地位。近几年,SAS公司又开发出了一款小巧的统计分析软件JMP,它兼有SAS的一些统计功能,同时又增加了DOE实验设计模块,中英文切换方便,中文输出统计结果一目了然,给研究者带来许多便利,其图形功能也很强大。 本书针对非数理统计专业的研究者缺乏系统的多元统计知识,时间紧、科研任务重,且需要在短时间内掌握所需要的统计分析方法并能应用到自己的科研数据分析中,编写了此教材。目标是使读者能快速掌握常用的多元统计分析方法,读懂输出结果,实用性强。 本书主要介绍SAS软件包的多元统计分析方法与JMP的DOE实验设计及相关统计分析方法。全书重点在于用实例讲解SAS与JMP软件包中的各种常用统计分析方法,并详细解释输出结果的统计学意义,比较两个软件相同统计方法输出内容的异同及优劣,方便读者从多角度应用。从实际应用出发,增加了JMP软件包中的DOE实验设计内容。 全书共9章,第1章主要介绍SAS与JMP软件基本操作;第2章主要介绍常用描述统计量、常用数据分布及参数检验概念;第3章讲述两个软件在t检验与非参数检验上的应用,并比较两个软件的优劣;第4章重点讲解JMP的DOE实验设计,包括: 定制设计、筛选设计、完全析因设计、响应面设计、田口设计,补充介绍正交设计;第5章结合第4章的实验设计方法,从多角度讲解方差分析应用,尤其详细介绍了SAS软件在多因素且存在交互作用的方差分析上的优势及结果讨论与判断,同时介绍协变量在协方差分析中的重要作用;第6章重点介绍曲线直线化回归、回归模型的多变量筛选、多变量的共线性诊断、非线性回归、Logistic回归,多方面介绍回归分析方法及相关分析,比较说明两种软件中SAS软件在回归分析中的优势;第7~9章介绍聚类分析、主成分分析和因子分析,比较两软件各自的优劣。 书中每种统计分析方法都以真实的科研数据为实例,从实验设计方法到数据整理、数据分析,详细解释各种统计分析方法的选项应用、输出内容的统计学意义,统计结果的判断依据,*优回归模型的筛选准则等,每种统计分析方法都运用SAS和JMP两种软件进行分析,比较两者的异同及优势,使学习者能够举一反三,学会选用科学、合理、简单方便的工具和方法,以判断并获取科学的、有价值的统计分析结果,尤其学会运用统计方法和思路。 由于JMP软件的输出是表格形式,但又不同于一般正文中的表格,为了与软件的输出保持一致,这类表格保留原样,不做处理。 本书可作为高校研究生、本科生的统计学教材,也适合非数理统计专业的研究人员作为数据分析的参考资料。 作者2016年8月
SAS统计分析及应用与JMP实验设计(第2版) 下载 mobi epub pdf txt 电子书 格式