内容简介
本书共分为三大部分:Ⅰ基础篇、Ⅱ案例研究、Ⅲ延伸。这其中包含10个章节,作者结合众多实验中的例子,探讨如何解决缺失数据的问题,此类问题广泛存在于各个领域之中。书中算法结合统计软件来实现,主要内容包括多元缺失填补、单变量数据缺失、多变量缺失数据、数据填补实践、填补数据分析、测量、选择、结论等。深入地讨论了解决这类问题的方法,并分析了每种方法的适用范围和有缺点。本书可作为高等院校统计学专业的本科高年级学生以及研究生用书,也可作为与统计学专业相关的科研人员的参考书。
目录
序(译) iii
前言(译) iv
关于作者 xxiv
符号描述 xxv
算法索引 xxvii
第I 部分 基础篇 1
1 概述 3
1.1 数据缺失问题 3
1.1.1 现行的方法 3
1.1.2 关于缺失数据的观点变化 5
1.2 关于MCAR、MAR 和MNAR 的概念 6
1.3 并不总奏效的简单方法 8
1.3.1 个案剔除法 8
1.3.2 成对剔除法 9
1.3.3 均值替代法 10
1.3.4 回归替代法 11
1.3.5 随机回归替代法 13
1.3.6 LOCF 和BOFC 方法 14
1.3.7 示性变量法 15
1.3.8 小结 15
1.4 多元数据填补简述 16
1.4.1 步骤 16
1.4.2 采用多元填补的原因 17
1.4.3 案例 18
1.5 本书的目的 20
1.6 本书未涵盖的内容 20
1.6.1 预防方法 21
1.6.2 权重程序 21
1.6.3 基于似然的处理方法 22
1.7 本书的结构 23
1.8 练习 23
2 多元填补 25
3单变量缺失数据53
4多变量缺失数据95
5数据填补实践123
6填补数据分析153
第II部分案例分析169
第III部分延伸247
附求A软件263
A.1 R263
A.2 S-Plus265
A.3 Stata265
A.4 SAS266
A.5 SPSS266
A.6其他软件266
参考文件269
作者索11 299
主题索引307
前言/序言
我们时常被缺失数据的情况所困扰。统计分析中由缺失数据所带来的问题长期被掩盖,现在这种情况正在慢慢结束。近十年间,处理缺失数据的技术迅速得到补充和发展。本书主要介绍一种方法:多重插补。
多重插补是统计科学领域重要的思想之一。这种技术简便、巧妙而且强大。说它简便是因为它填补了由似是而非的数据造成的漏洞,说它巧妙是因为未知数据的不确定性被数据本身所标记,说它强大是因为它可以解决那些被掩饰的数据缺失问题。
在近二十年的时间里,我已经将多重插补应用到了更广泛的研究领域中。我相信多重插补进入统计学主流的时机已经成熟。当今计算机和软件技术已能够充分满足计算的需要。我们所欠缺的是关于介绍这些基本思想及这些思想该如何应用的书。我希望这本书能够弥补这个欠缺。
本书正文的阅读要求读者通晓统计学基础概念和多元统计方法。本书特别为如下两类读者而设计:
* 社会和健康科学领域的(生物)统计学家、流行病学家等;* 不称呼自己为统计学家,但拥有必要的技能来理解规则并使用一些统计方法的独立的研究者。
在编写本书的时候,我尽量避免数学和技术上的细节,出现公式的地方往往辅之以图表,并用可视化的陈述来解释该公式。我希望读者朋友们可以较少去关注理论基础,而更多去抓住宏观的总体上的思路。偏技术的内容在本书中标记了黑色桃心,这在第一次阅读时可以暂时跳过。
我在乌得勒支大学采用了本书中的一些章节来教授研究生插补技术的课程,主要的基础内容体现在1~4 章,大约要花费十个小时来讲授这些材料,中间留出时间可以让学生们完成书中的练习题。
本书采用了大量唐纳德·鲁宾(Donald Rubin)的理念,他是多元插补这个学科的奠基人之一。我非常有幸在很多场合与他见面、讨论和工作。他富于逻辑的设想和貌似简单的想法是我的灵感的极佳的来源。同时要感谢杨·范·瑞吉克沃塞勒(Jan van Rijckevorsel),通过他我认识了鲁宾。他还在TNO 营造了科学研究的氛围,在那里我们能够很愉快地完成缺失数据的插补工作。
很多人对本书的完成做出了贡献。感谢TNO 的Nico van Meeteren 和Michael Holewijn 给了我极大的信任和支持。感谢乌得勒支大学的Peter vander Heijden 的支持。感谢Rob Calver 和Chapman & Hall/CRC 的工作人员的帮助和建议。许多人对本书的全部或者部分稿件提出了建议,他们分别是Hendriek Boshuizen,Elise Dusseldorp,Karin Groothuis-Oudshoorn,MichaelHermanussen,Martijn Heymans,Nicholas Horton,Shahab Jolani,GerkoVink,Ian White 和2011 春季班的硕士研究生们。他们的建议对于发现和排除书中的错误起到了很有价值的作用,同时我也对剩下的错误感到抱歉。
本书的主要部分是在一个为期六个月的旅行中完成的。其中有四个月在克鲁克,瑞典的一个只有八间小房子的村子。感谢Frank van denNieuwenhuijzen 和Ynske de Koning 非常热情地把他们的房子给我用。那里的设备非常完美,没有雪崩,没有琐碎的麻烦。另外两个月我在德国阿尔滕霍夫的Michael Hermanussen 和Beate Lohse-Hermanussen 的住宅里,我感谢他们的和善、创造力和聪慧,那是一段无比美好的时光。
最后,感谢我的家人,尤其是我深爱的妻子Eveline,感谢他们温暖的、一如既往的支持,支持我花费大量的时间——晚上、周末,来完成这本书。
Eveline 喜欢告诉别人我正在完成“一本没人能看懂的书”来与我开玩笑。
我有时甚至怀疑她说的是正确的,至少有99% 的人是看不懂的。那么,亲爱的读者,我真心希望你将属于那剩下的1%。
作者:史蒂夫·范·布伦v
缺失数据的灵活填补方法(英文影印注释版) 下载 mobi epub pdf txt 电子书 格式