缺失数据的模型检验及其应用

缺失数据的模型检验及其应用 pdf epub mobi txt 电子书 下载 2025

许王莉 著
图书标签:
  • 缺失数据
  • 模型检验
  • 统计推断
  • 数据分析
  • 应用统计
  • 数据清洗
  • 统计模型
  • 假设检验
  • 数据质量
  • 填补方法
想要找书就要到 图书大百科
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
出版社: 科学出版社
ISBN:9787030392558
版次:1
商品编码:11383577
包装:平装
丛书名: 现代数学基础丛书
开本:32开
出版时间:2014-01-01
用纸:胶版纸
页数:464
正文语种:中文

具体描述

编辑推荐

  缺失数据越来越多的存在于生物统计等应用领域,如果对缺失数据用错误的模型拟合,做出的统计推断可能是无效的。所以,关于缺失数据模型的拟合优度问题,无论对于理论研究还是实际应用研究都具有重要的意义。目前关于缺失数据模型检验的中文书很少,本书主要研究了此问题,对于理论和实际应用工作者都具有借鉴意义。

内容简介

  《缺失数据的模型检验及其应用》主要研究缺失数据模型的检验问题。《缺失数据的模型检验及其应用》共分为8章。第1章主要介绍数据的不同缺失机制,包括协变量缺失和因变量缺失,以及在不同缺失机制下常见的统计分析方法。第2章介绍一些常见的检验方法,主要包括蒙特卡罗检验和得分类型的检验。在蒙特卡罗检验这部分,着重介绍参数和非参数蒙特卡罗检验方法。第3章介绍在数据不存在缺失的情况下,几种常见模型的检验方法及其性质。第4章是关于在因变量缺失时,部分线性模型中非线性部分是否符合某类参数结构的拟合优度检验问题。第5章讨论协变量随机缺失时,广义线性模型本身的拟合优度检验问题。第6章对于变系数模型,在响应变量缺失的情况下,研究变系数部分是否具有一定参数结构的检验。第7章研究的是协变量缺失时候的统计推断问题。第8章的主要内容是因变量随机缺失的情况下,变系数模型本身的拟合优度检验问题。第4章到第8章的检验统计量主要采用蒙特卡罗检验和得分类型的检验。

作者简介

  许王莉,中国人民大学统计学院副教授,医学与生物统计教研室主任。先后访问过香港大学,香港浸会大学和美国北卡罗莱纳大学教堂山分校。近年来一直从事模型的拟和优度检验,随机缺失数据,两阶段抽样数据以及纵向数据分析的研究。今年来承担了“新世纪优秀人才计划”,“北京市科技新星计划”,国家自然科学面上基金,国家自然科学青年基金和教育部人文社科基金等多项科研课题。在Biometrka, Biostatistics, Statistica Sinica , Scandinavian Journal of Statistics , Journal of Multivariate Analysis等国际重要期刊发表和接受SCI论文24篇。

目录

前言
符号表
第1章 缺失数据
1.1 协变量缺失机制
1.2 协变量缺失的处理方法
1.2.1 完整个体分析
1.2.2 基于插补数据的方法
1.2.3 基于似然的方法
1.3 响应变量缺失机制
1.4 响应变量缺失的处理方法
第2章 常用的一些检验方法
2.1 蒙特卡罗检验
2.1.1 参数蒙特卡罗检验
2.1.2 非参数蒙特卡罗检验
2.2 得分类型的检验
第3章 完全数据模型的假设检验
3.1 广义线性模型的研究
3.1.1 统计量的渐近性质
3.1.2 蒙特卡罗近似
3.2 部分线性模型的研究
3.3 变系数模型的关于模型的检验
3.3.1 检验统计量及其极限性质
3.3.2 蒙特卡罗近似
3.4 变系数模型的关于回归系数的检验
3.4.1 检验步骤
3.4.2 检验统计量的近似表现
第4章 因变量缺失时部分线性模型拟合优度检验
4.1 引言
4.2 完全数据的构造以及模型的估计
4.3 检验统计量及其渐近性质
4.4 蒙特卡罗逼近
4.5 数值分析
4.5.1 模拟研究
4.5.2 实际数据分析
4.6 定理的证明
第5章 协变量随机缺失时广义线性模型的拟合优度检验
5.1 检验步骤
5.1.1 检验统计量的构造
5.1.2 检验统计量的极限性质
5.2 数值分析
5.2.1 模拟研究
5.2.2 实例分析
5.3 定理的证明
第6章 响应变量缺失时变系数模型的非参数检验
6.1 引言
6.2 检验统计量的构造
6.3 统计量的渐近性质
6.4 蒙特卡罗近似
6.5 数据分析
6.5.1 模拟研究
6.5.2 应用于一个环境数据
6.6 定理的证明
第7章 协变量随机缺失时部分线性模型的拟合优度检验
7.1 引言
7.2 检验步骤
7.2.1 检验统计量的构建
7.2.2 检验统计量的渐近性质
7.3 数据分析
7.3.1 模拟研究
7.3.2 实际数据分析
7.4 定理的证明
第8章 响应变量随机缺失时变系数模型的拟合优度检验
8.1 引言
8.2 检验统计量的构造
8.3 渐近性质
8.4 蒙特卡罗近似
8.5 数据分析
8.5.1 模拟研究
8.5.2 应用于一个环境数据集
8.6 定理的证明
参考文献
索引

前言/序言


深入探索经典文学巨著:一部未曾涉及现代数据科学的书籍简介 书名:《失落的星辰与古老的誓言》 作者:艾莉莎·凡尔纳 出版社:永恒之光书局 字数:约1500字 --- 简介: 《失落的星辰与古老的誓言》是一部宏大叙事的史诗性小说,它将读者带入一个架空的中世纪末期,一个被魔法与宿命交织的世界。故事的核心围绕着两个古老家族——高耸入云的“苍穹之塔”的继承者,以及深藏于地底的“影月氏族”——之间长达百年的恩怨情仇。 本书并非探讨现代科学或抽象的理论模型,而是专注于探究人类情感的深度、历史的重量以及个体在宏大命运面前的选择与挣扎。它是一部关于荣誉、背叛、爱情与牺牲的史诗,其笔触细腻入微,构建了一个既熟悉又充满奇幻色彩的复杂社会结构。 --- 故事背景与世界观构建: 故事发生在“埃索利亚大陆”,一个由元素魔法和古老信仰主导的地域。大陆被一道被称为“永恒之墙”的巨大山脉分割,象征着光明与黑暗、秩序与混沌的两个主要文明的对立。 苍穹之塔(House of the Zenith): 居住在大陆中央的空中堡垒中,他们是公认的智慧与光明的守护者。塔内的学者和骑士团维护着“天穹法典”,一套关于宇宙运行和道德准则的古老律法。他们的历史记载详尽,但其记录往往带有维护自身正统性的偏颇,将外界视为未开化的野蛮之地。 影月氏族(The Lunar Kin): 世代隐居于地底深处的熔岩洞穴和水晶矿脉之中。他们掌握着与大地和暗影元素沟通的禁忌魔法,被塔上人视为邪恶的源头。影月氏族的生活哲学是“根植于腐朽,方能孕育永恒”,他们崇拜循环往复的生命与死亡的自然法则。 小说的时间跨度长达三代人的命运浮沉,详尽描绘了两个文明在资源枯竭和古老预言的驱使下,如何一步步走向不可避免的冲突。 主要人物群像: 1. 凯伦·泽菲尔(Kaelen Zephyr): 苍穹之塔的年轻继承人。他本应是秩序的完美体现,但内心深处对塔内僵化的教条和压抑的真相感到不安。他是一位天赋异禀的符文雕刻师,他发现家族历史文献中存在多处“空白”或“被抹去”的记载,这促使他秘密地质疑他所信仰的一切。 2. 薇拉·暗影(Vira Shadowmere): 影月氏族的下一任首领。她冷静、果断,肩负着族群生存的重任。她并非传统意义上的“恶棍”,她的行动完全基于保护族人的需要,对塔上人充满了警惕和不信任。薇拉精通“血脉回溯”的古老技艺,能够感知过去的强烈情绪残留。 3. 盲眼先知埃尔德林(Elderin the Blind Seer): 居住在永恒之墙的隐士,唯一一个能被双方信任(或至少是敬畏)的人。他通过解读风的低语和岩石的震颤来预言未来,他的话语晦涩难懂,但总是指向一个核心的真相:两个家族的命运在远古时曾紧密相连。 叙事结构与主题探讨: 本书采用了多重叙事视角,穿插着大量的手稿摘录、古代吟游诗人的歌谣以及家族信函,以增强历史的厚重感和真实性。 核心主题包括: 历史的建构与篡改: 故事深入探讨了胜利者如何书写历史,以及被边缘化的声音如何被沉默。凯伦对“缺失记录”的探寻,实际上是对被掩盖的真相的追逐。 界限的消融与共存的可能性: 随着冲突的升级,凯伦与薇拉不得不进行危险的接触。他们必须克服种族偏见,理解对方的生存逻辑,探索超越对立的道路。这并非简单的“王子与公主的结合”,而是在巨大结构性矛盾下,两个领导者为了避免种族灭绝而做出的艰难妥协与学习。 宿命与自由意志的辩证: 贯穿全书的是一个古老的预言,声称两个家族的终结将带来世界的彻底毁灭。读者将跟随主角们挑战这个看似不可动摇的“命运”,思考人类是否有能力在既定的框架内重塑自己的未来。 文学价值与风格: 《失落的星辰与古老的誓言》以其细致入微的环境描写和深刻的人物心理刻画而著称。作者凡尔纳运用了富有韵律感的语言,营造出一种古典的史诗氛围。小说中没有涉及现代统计学概念、算法优化或数据拟合等技术性内容。相反,它聚焦于人类在信息不完全、信仰冲突的环境中,如何依据直觉、经验和有限的线索做出影响千年的决策。 读者将沉浸在一个充满奇观、阴谋和深刻哲学反思的世界中,体验一场关于如何面对“未知”和“被禁止的知识”的史诗冒险。这本书旨在引发读者对权力结构、历史责任以及个体良知如何抵抗集体盲从的思考。它是一次对人类精神韧性的致敬。

用户评价

评分

读完这本《缺失数据的模型检验及其应用》后,我最大的感受是其理论深度与实践应用的完美结合。作者在书中并非仅仅罗列了各种缺失数据处理的算法,而是深入浅出地剖析了不同算法背后的数学原理和统计假设,比如在讨论多重插补(Multiple Imputation)时,详细阐述了MAR(Missing At Random)、MCAR(Missing Completely At Random)和MNAR(Missing Not At Random)等概念的由来和辨析,并详细推导了MCMC(Markov Chain Monte Carlo)在生成填充值过程中的核心作用。这一点对于我这种希望知其然更知其所以然的读者来说,简直是福音。很多时候,我们在处理实际数据时,遇到的挑战不仅仅是选择一个现成的 imputation 方法,更在于理解为什么这个方法有效,在什么条件下无效,以及如何根据数据的具体特征来调整参数。这本书提供了这样的底层知识支撑。我尤其喜欢其中关于缺失数据对统计推断影响的章节,它清晰地揭示了忽略缺失数据可能导致的偏差,比如估计量的偏倚和方差的低估,并且通过严谨的数学证明,让我们对选择合适的处理方法的重要性有了更深刻的认识。对于任何希望在机器学习、统计建模或数据科学领域做出严谨研究的人来说,这本书的理论基础部分绝对是不可或缺的。

评分

这本书最令我印象深刻的是其章节之间流畅的过渡和由此形成的完整知识体系。它并没有孤立地介绍各种缺失数据处理技术,而是将它们置于一个更宏观的模型检验框架下进行讨论。例如,在介绍完几种基本的插补方法后,作者并没有止步于此,而是紧接着探讨了如何检验这些插补方法是否引入了新的偏见,以及如何评估包含填充数据的模型推断结果的稳健性。我特别欣赏其中关于“后插补检验”(post-imputation validation)的讨论,它提供了一套系统性的方法来评估填充数据的质量和模型在处理缺失数据后的表现,比如使用信心区间覆盖率、模型拟合优度指标以及敏感性分析等。这对于我来说,解决了一个长久以来的困惑:如何判断自己处理缺失数据的方法是有效的,而不是简单地“蒙混过关”。书中还结合了大量的案例研究,涵盖了金融、医疗、社会科学等多个领域,生动地展示了缺失数据处理在实际问题中的应用。这些案例不仅是理论的佐证,更是宝贵的实操指南,让我能更好地将书中的知识迁移到自己的研究项目中。

评分

从实操的角度来看,这本书的指导意义非常巨大。作者在讲解各种算法时,不仅提供了详细的数学公式,还辅以清晰的伪代码和在 R、Python 等主流统计软件中的实现示例。我尤其欣赏其中关于“混合效应模型”(mixed-effects models)与缺失数据结合的章节,这对于处理具有重复测量或分组结构的数据尤为重要。书中详细演示了如何使用`lme4`包在 R 中进行插补和模型拟合,并对结果进行解读。此外,作者还花了相当大的篇幅讨论了缺失数据对机器学习模型的影响,比如在逻辑回归、支持向量机、决策树等模型中,如何有效地处理缺失特征,以及如何评估这些方法的表现。这一点对于我从事数据分析工作至关重要,因为在实际业务场景中,我们经常需要面对海量的不完整数据。书中的很多技巧,比如基于规则的填充(rule-based imputation)和基于模型预测的填充(model-based imputation)的权衡,以及如何进行交叉验证来选择最佳的填充策略,都为我提供了非常直接的操作指导。

评分

这本书的叙事方式非常独特,它不像一些学术著作那样枯燥乏味,而是通过一种“循序渐进”的方式引导读者进入缺失数据处理的世界。作者在开篇就明确了本书的目标读者是具有一定统计学和建模基础的研究人员和从业者,但同时也花了大量的篇幅来回顾必要的统计概念,确保读者不会因为基础知识的欠缺而感到障碍。我尤其喜欢书中对“贝叶斯方法”(Bayesian methods)在缺失数据处理中的应用的深入探讨,它不仅解释了贝叶斯思想如何能够更自然地处理不确定性,还详细介绍了如何使用 Stan、JAGS 等软件进行贝叶斯建模和插补。这为我打开了一个新的视角,让我意识到传统的最大似然估计可能存在的局限性,以及贝叶斯方法在处理复杂缺失数据模式时的优势。此外,书中对“缺失数据的敏感性分析”(sensitivity analysis for missing data)的详细讲解,让我深刻理解到,即使我们尽力处理了缺失数据,仍然需要评估我们的结论在不同缺失数据机制下的稳健性。

评分

这本书的另一个亮点在于其前瞻性和广度。作者在结尾处不仅仅是对已有技术的回顾,还对未来缺失数据研究的发展方向进行了展望,例如在大数据环境下如何更有效地处理海量缺失数据,以及深度学习在缺失数据插补和建模中的应用潜力。我特别关注了其中关于“因果推断”(causal inference)与缺失数据处理相结合的讨论,这在我看来是统计学和数据科学领域的一个重要前沿。书中探讨了在存在缺失数据的情况下,如何进行准确的因果效应估计,以及如何设计实验来最小化缺失数据的影响。这让我认识到,缺失数据的处理不仅仅是为了完成建模任务,更是为了获得可靠的统计推断结果,尤其是在需要做出决策或解释现象的场景下。整本书的知识密度很高,但由于其逻辑清晰、语言精炼,并且配合了丰富的图表和公式推导,使得阅读过程相对轻松且收获颇丰,是一本值得反复研读的经典之作。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 book.teaonline.club All Rights Reserved. 图书大百科 版权所有