内容简介
估计方程方法是统计推断中*为普通但也非常有用的统计推断方法之一,其思想和结果广泛应用于生存分析、生物统计、计量经济及金融计量中。周勇所著的《广义估计方程估计方法/现代数学基础丛书》共分20章和两个附录,着重讨论参数模型、时间序列模型、非参数模型、半参数及变系数模型等模型中有关估计方程的统计推断方法,并讨论几种现代统计学中通常遇见的数据类型下估计方程方法。这是目前新的统计推断方法,主要包括*为常见的独立样本、非独立样本(时间序列样本)、纵向数据、缺失数据、缺失数据等下的估计方程方法。《现代数学基础丛书·典藏版:广义估计方程估计方法》总结了一批应用估计方程方法进行统计推断的统计模型,同时也概括了可以应用一般估计方程方法处理的复杂数据。书中内容除了数理统计的常用统计推断方法外,也包括新统计方法有关估计方程估计的研究成果。
《现代数学基础丛书·典藏版:广义估计方程估计方法》适合大学数理统计专业、数学专业和计量经济学专业等高年级的学生做选修课程,同时也可作为是数理统计、统计学以及计量经济学等专业研究生专业基础课教程。另外,《现代数学基础丛书·典藏版:广义估计方程估计方法》还适合各行各业的应用数理统计科学工作者,主要涉及经济、金融、社会学、心理学、生物医学和工业工程等专业人士。
内页插图
目录
《现代数学基础丛书》序
前言
第1章 绪论
1.1 估计方程估计方法概述
1.2 统计模型与估计方程
1.3 带有辅助信息的估计方程估计
1.4 估计方程估计的渐近性质概述
1.5 广义估计方程估计相合性
第2章 数据类型
2.1 简单数据
2.2 时间序列数据
2.3 删失数据
2.4 缺失数据
2.5 纵向数据(面板数据)
第3章 准备知识
3.1 随机变量序列收敛性
3.2 大数律与中心极限定理
3.2.1 弱大数律和强大数律
3.2.2 重对数律
3.2.3 中心极限定理
3.2.4 估计的大样本性质
3.3 一致大数律及经验过程
3.4 一般极限定理
3.5 其他一些收敛定理
第4章 Delta方法
4.1 Delta方法的思想
4.2 向量估计函数Delta方法
4.3 相关研究及扩展
第5章 矩估计与极大似然
5.1 矩估计
5.2 极大似然估计
5.3 极大似然估计理论
5.4 信息阵及C-R不等式
5.5 有关极大似然估计的假设检验
5.6 删失数据下极大似然估计
5.7 截断数据极大似然
5.8 缺失数据极大似然估计
5.9 不可忽略缺失机制下的极大似然估计
5.10 条件似然估计
5.11 相关研究及扩展
第6章 极值目标函数估计
6.1 广义估计方程估计
6.2 极值目标函数估计
6.3 极值函数估计量的存在性与可测性
6.4 几类重要的极值函数估计
6.5 极值函数估计的相合性与渐近正态性
6.6 渐近方差估计
6.7 极值函数估计统计推断:拉格朗日检验及置信区间
6.8 主要结果证明
6.9 补充材料
第7章 经验似然及估计方程
7.1 经验似然的基本思想及概念
7.2 一维均值经验似然
7.3 多维均值经验似然
7.4 估计方程经验似然推断
7.5 有偏抽样经验似然
7.6 相关研究及拓展
7.7 主要定理的证明
第8章 伪极大似然
8.1 伪极大似然估计及推断
8.2 分布误判及伪似然估计
8.3 伪似然估计相合性的充要条件
8.4 关于伪似然估计的假设检验
8.5 小结及讨论
8.6 补充材料
……
第9章 估计方程估计的渐近理论
第10章 估计方程的一般思想
第11章 指数族及广义线性模型
第12章 纵向数据估计方程
第13章 非参数估计方程
第14章 非参和半参局部拟似然估计
第15章 非参数时间序列估计方程方法
第16章 删失数据下估计方程
第17章 两样本估计方程
第18章 光滑经验似然
第19章 缺失数据估计方程
第20章 缺失数据下分位数回归
附录A 计数过程及其鞅理论
附录B 非参数回归
参考文献
索引
《现代数学基础丛书》已出版书目
前言/序言
估计方程方法是统计推断中最为普通但同时也是非常有用的统计推断方法之一,其思想和方法广泛应用于生存分析、生物统计、工程统计、管理统计、计量经济学,以及金融计量学等学科领域中,本书着重讨论参数模型、时间序列模型、非参数模型、半参数及变系数模型等模型中有关估计方程的统计推断方法,并讨论几种现代统计学中经常遇到的数据类型下的估计方程估计方法。这些是目前较新的统计推断方法,主要包括最为常见的独立样本、时间序列样本、纵向数据、删失数据、缺失数据等复杂数据下的估计方程估计方法。一般地,估计方程的估计可以看作为最大似然估计和矩估计方法等古典概率统计推断方法的推广,并涉及GMM估计、拟似然估计、伪似然估计和广义最小二乘估计、经验似然估计等。结合各种数据类型和相适应的统计模型,深入地展示这些统计推断的理论和方法以及它们在实际中的应用,本书理论与实践相结合,灵活地运用估计方程方法,使学习者能够在学习本书的过程中,发现统计方法的奇妙和无穷魅力,同时能通过掌握这些方法使学习者能在较短的时间里追上国际前沿,以及熟练地应用这些方法,甚至在统计学的方法及理论上进行创新研究。
本书主要涉及概率统计、生存分析、生物医学统计、计量经济学和金融风险管理等常用的统计模型及其方法,本书总结了一系列应用估计方程估计方法进行统计推断的统计模型,并概括了可以应用一般估计方程估计方法处理的复杂数据。书中除了常用的传统统计推断方法外,也包括最新的有关估计方程估计的研究成果,
本书适合大学数理统计专业、数学专业和计量经济学等专业高年级本科生选修课程,同时也可作为数理统计、统计学以计量经济学等专业方向的研究生基础课程,另外,本书还适合各行各业应用数理统计科学工作者和经济、金融、社会学、心理学、生物医学和工业工程等专业人士。
全书分为20章,第1章绪论,对全书的内容进行了概述,并给出一些基本结果,以使读者能很快地了解全书的内容和所涉及的理解和方法,第2章和第3章是准备知识,主要介绍一些估计方程方法的相关基础知识和常用的数据类型,以及统计大样本的常用极限理论,涉及大数律、中心极限定理,以及一致大数律等。如果读者对理论不感兴趣,则只需知道结论而跳过理论证明即可。第4章介绍的Delta方法是一种常用工具,在推断参数函数估计的大样本性质时,特别是渐近方差时,非常有用和有效,
第5章介绍两种经典的统计方法,即矩估计和极大似然估计方法,这两种方法在一般的教科书上都有介绍,但并不十分全面,本书旨在通过更为全面的介绍,让读者对统计推断方法有更深入的理解,同时,本书的其他章节都是以极大似然估计方法为参照,应用估计方程的过程与应用极大似然估计方法具有相似性,首先是参数估计,其次构造置信区间或进行假设检验,理论结果也类似,当然不同数据类型和模型下结论各异,但是,掌握了最基础的极大似然估计将有助于理解书中其他复杂的方法。另外本章还介绍了一些复杂数据下的极大似然估计,
第6章的极值目标函数估计方法是估计方程估计方法的一般化,但它有独立的意义,因此,有关极值目标函数估计可自成一章,让读者能够很容易掌握处理估计方程的一般方法。在第9章将提供一些选择最优估计函数的框架和方法,
第7章介绍了经验似然估计方法及其在估计方程中的统计推断问题,经验似然方法是处理过识别估计方程组最有力的两种工具之一,本章也介绍了一些较新的复杂数据下的经验似然方法,感兴趣的读者如果学习完这章,已足够进入统计的研究前沿,并能进行相关的研究工作。
第8章是极大似然方法的扩展——伪似然方法,拟似然方法不像极大似然方法需要知道真实的分布函数,从而避免或减小了模型误判的问题,拟似然方法是处理估计方程问题的一种重要方法,其思想具有一般性,
第9章介绍了广义估计方程估计方法及这些估计良好的大样本性质,还讨论了广义估计方程估计的最优方差,即最优估计方程等问题,本章总结了最优估计函数的思想及方法,它是本书的重要基础之一。
第10章是估计方程方法的一般思想,是本书的重点之一,讨论了如何构造无偏估计函数来获得估计方程,并通过几个实用的模型来理解利用广义估计方程估计方法建模的问题,同时也涉及了最优估计方程的一般思想。本章还重点探讨了生存分析中几类重要模型构造估计方程的思想方法,并指出估计方程方法在生存分析中具有广泛的应用。
第11章讨论了广义线性模型的一般理论和估计方法,简单介绍了指数分布族及在指数分布族下广义线性模型的极大似然估计,以及在非指数族分布族下,给出了广义线性模型中参数的拟极大似然估计,并讨论了拟极大似然估计与估计方程的关系,
第12章讨论了纵向数据下的估计方程方法。利用估计方程估计方法可以有效处理纵向数据的相关性,并给出工作方差对估计的影响。
第13章介绍了很广泛的一类非参数估计方程,可以包括半参数模型、变系数模型等,主要通过局部光滑技术有效地得出参数或非参数的估计方程估计。这里给出了非参数估计方程的统计推断的一般方法,并应用于一个重要的实际例子中。
好的,这是一份关于《现代数学基础丛书·典藏版:广义估计方程估计方法》的图书简介,内容详实,聚焦于该领域的核心理论与实践应用,旨在为读者勾勒出该书的知识架构与学术价值。 --- 现代数学基础丛书·典藏版:广义估计方程估计方法 导论:统计推断的基石与模型选择的挑战 本书深入探讨了统计学和计量经济学领域中一类强大而灵活的估计工具——广义估计方程(Generalized Estimating Equations, GEE)方法。在经典回归分析(如最小二乘法或极大似然估计)的框架下,我们通常需要对数据的分布做出强烈的假设,尤其是针对残差或误差项的独立性和同方差性。然而,在面对现实世界中大量复杂数据结构时,这些假设往往被打破。 本书聚焦于处理纵向数据(Longitudinal Data)、聚类数据(Clustered Data)以及其他形式的非独立观测数据。在这些场景下,同一研究对象或同一聚类内部的观测值之间存在着显著的内部相关性(或称作组内相关性)。如果忽视这种相关性而采用传统方法进行估计,得到的标准误(Standard Errors)将会是有偏的,从而导致推断结论的可靠性大打折扣,甚至得出错误的统计显著性判断。 GEE方法正是在这种背景下应运而生,它提供了一种无需精确指定误差项的协方差结构,就能获得一致且渐近正态的参数估计值。本书的价值在于,它不仅系统梳理了GEE方法背后的严谨数理基础,更侧重于其在实际统计建模中的操作细节与应用潜力。 第一部分:理论基石——从普通最小二乘到非独立数据的拓展 本书的开篇部分,着重于奠定读者理解GEE方法的数学基础。首先,它回顾了经典线性模型(CLM)和极大似然估计(MLE)的核心思想,强调了独立同分布(i.i.d.)假设的重要性及其局限性。 随后,引入矩估计(Method of Moments)的概念,这是GEE方法的理论源头。GEE的本质是构建一组评分函数(Score Functions)或矩条件,使得这些函数在总体上期望值为零。通过求解这些方程组,我们可以得到参数的估计量。 关键概念的深入阐述包括: 1. 估计方程的构造: 详述了如何根据数据结构构建估计方程。在GEE框架下,参数估计量 $eta$ 满足以下形式的矩方程: $$ sum_{i=1}^{N} left[ frac{partial mu_i}{partial eta}
ight]^T V_i^{-1} (Y_i - mu_i) = 0 $$ 其中,$mu_i$ 是均值函数(依赖于回归因子 $mathbf{X}_i$ 和待估参数 $eta$),而 $V_i$ 则是表示观测值内部相关性的“工作”协方差矩阵(Working Covariance Matrix)。 2. “工作”协方差矩阵的角色: 强调GEE方法最大的优势在于其对 $V_i$ 的选择具有极大的鲁棒性。即使我们对 $V_i$ 的结构指定错误(即“工作”结构与真实结构不符),只要估计方程的其余部分是正确的,参数估计 $hat{eta}$ 仍然是一致的(Consistent)。本书详细对比了五种常用的工作结构:独立结构、对角结构、复合对称结构、AR(1)结构以及自定义结构,并讨论了在信息缺失时如何选择最稳健的结构。 3. 稳健标准误(Robust Standard Errors)的推导: 相比于参数估计本身,GEE方法最关键的贡献在于其拟最大似然(QML)意义下的稳健协方差矩阵估计(即“Sandwich”估计器)。本书详细推导了这一估计量的具体形式,揭示了其如何校正因模型误设导致的估计方差夸大或缩小问题,从而保障统计推断的有效性。 第二部分:应用实践——纵向数据与聚类分析的精确建模 本书的第二部分转向实际应用,重点展示GEE方法如何高效解决生物医学、社会科学和市场营销中的核心问题。 2.1 纵向数据的处理与时间依赖性 在医学试验或面板数据分析中,研究对象在多个时间点被重复测量。GEE方法在此处展现出优于标准重复测量方差分析(ANOVA)或标准线性混合模型(LMM)的灵活性。 时间依赖性建模: 详细介绍了如何利用GEE处理不同时间点之间的相关性。例如,对于一个有 $T$ 个时间点的研究,复合对称结构假设所有时间点之间的相关系数 $
ho$ 相同,而AR(1)结构则假设相关性随时间间隔的增大而减小。 效应的解释: 讨论了GEE估计的回归系数(如 $eta_1$)的解释——它们通常代表了“平均效应”或“总体平均响应”,与混合模型中关注的“个体特定效应”有所区别。 2.2 聚类数据的异质性与非独立性 当数据按自然群组(如学校、医院、家庭)聚类时,GEE同样适用。 群组内相关性建模: 阐述了如何使用GEE处理非嵌套的聚类数据。重点分析了当集群大小不一时,如何通过正确的加权和迭代过程确保估计的准确性。 对特定模型的适用性: 虽然本书重点讨论线性模型下的GEE(即Liang & Zeger, 1986),但也扩展介绍了泊松GEE(用于计数数据)和Logit/Probit GEE(用于二元或比例数据)的应用。例如,在分析某地区不同医院的感染率时,由于患者的治疗方案和护理质量在医院内部是相关的,GEE能够提供可靠的医院间差异估计。 第三部分:进阶议题与方法论的比较 为了使读者能够全面掌握GEE方法的地位和局限,本书的最后部分进行了深入的方法论探讨。 3.1 模型选择与信息准则的局限性 GEE方法的一个重要特点是,它不直接提供基于似然的优度检验,因为其基于的工作协方差结构通常是错误的。本书详细讨论了如何评估模型拟合优度: 拟合信息准则(GEE-based Information Criteria): 介绍了修正的准则,如QIC (Quasi-likelihood Information Criterion),该准则在标准AIC/BIC的基础上,加入了对协方差矩阵误设所导致的额外惩罚项,从而更合理地在模型复杂度和拟合度之间进行权衡。 残差分析: 强调了对标准化残差进行结构化分析的重要性,即使是稳健估计,也不能完全替代对模型假设的审视。 3.2 GEE与混合模型(LMM/GLMM)的对比 这是统计建模中的一个经典问题。本书清晰地划分了GEE和混合效应模型的使用场景: GEE的优势(群体焦点): 适用于关注总体平均效应,且对协方差结构不确定性较大的情况。其估计量对协方差结构误设具有高度稳健性。 混合模型的优势(个体焦点): 适用于需要关注个体间异质性(随机效应)或需要进行个体水平预测的场景。混合模型提供了对协方差结构的更完整、更详细的描述。 3.3 迭代算法与计算实现 本书最后提供了GEE估计实现所需的迭代算法步骤,通常采用牛顿-拉夫逊法或迭代重加权最小二乘法(IRLS)的变体。详细展示了如何交替更新参数估计 $eta$ 和工作协方差矩阵 $V_i$ 直至收敛。 总结 《现代数学基础丛书·典藏版:广义估计方程估计方法》是一部面向高级统计学、计量经济学和生物统计学研究者的专著。它不仅是理论探索的深度指南,更是处理复杂、非独立数据结构的实践手册。通过本书,读者将掌握一种无需过度依赖严格分布假设,即可获得可靠统计推断的强大工具,从而提升其在处理真实世界复杂数据集时的分析能力与洞察力。本书的典藏价值在于其对方法论的严谨阐述和对实际操作细节的详尽覆盖,是统计学方法论领域不可或缺的参考资料。