內容簡介
估計方程方法是統計推斷中*為普通但也非常有用的統計推斷方法之一,其思想和結果廣泛應用於生存分析、生物統計、計量經濟及金融計量中。周勇所著的《廣義估計方程估計方法/現代數學基礎叢書》共分20章和兩個附錄,著重討論參數模型、時間序列模型、非參數模型、半參數及變係數模型等模型中有關估計方程的統計推斷方法,並討論幾種現代統計學中通常遇見的數據類型下估計方程方法。這是目前新的統計推斷方法,主要包括*為常見的獨立樣本、非獨立樣本(時間序列樣本)、縱嚮數據、缺失數據、缺失數據等下的估計方程方法。《現代數學基礎叢書·典藏版:廣義估計方程估計方法》總結瞭一批應用估計方程方法進行統計推斷的統計模型,同時也概括瞭可以應用一般估計方程方法處理的復雜數據。書中內容除瞭數理統計的常用統計推斷方法外,也包括新統計方法有關估計方程估計的研究成果。
《現代數學基礎叢書·典藏版:廣義估計方程估計方法》適閤大學數理統計專業、數學專業和計量經濟學專業等高年級的學生做選修課程,同時也可作為是數理統計、統計學以及計量經濟學等專業研究生專業基礎課教程。另外,《現代數學基礎叢書·典藏版:廣義估計方程估計方法》還適閤各行各業的應用數理統計科學工作者,主要涉及經濟、金融、社會學、心理學、生物醫學和工業工程等專業人士。
內頁插圖
目錄
《現代數學基礎叢書》序
前言
第1章 緒論
1.1 估計方程估計方法概述
1.2 統計模型與估計方程
1.3 帶有輔助信息的估計方程估計
1.4 估計方程估計的漸近性質概述
1.5 廣義估計方程估計相閤性
第2章 數據類型
2.1 簡單數據
2.2 時間序列數據
2.3 刪失數據
2.4 缺失數據
2.5 縱嚮數據(麵闆數據)
第3章 準備知識
3.1 隨機變量序列收斂性
3.2 大數律與中心極限定理
3.2.1 弱大數律和強大數律
3.2.2 重對數律
3.2.3 中心極限定理
3.2.4 估計的大樣本性質
3.3 一緻大數律及經驗過程
3.4 一般極限定理
3.5 其他一些收斂定理
第4章 Delta方法
4.1 Delta方法的思想
4.2 嚮量估計函數Delta方法
4.3 相關研究及擴展
第5章 矩估計與極大似然
5.1 矩估計
5.2 極大似然估計
5.3 極大似然估計理論
5.4 信息陣及C-R不等式
5.5 有關極大似然估計的假設檢驗
5.6 刪失數據下極大似然估計
5.7 截斷數據極大似然
5.8 缺失數據極大似然估計
5.9 不可忽略缺失機製下的極大似然估計
5.10 條件似然估計
5.11 相關研究及擴展
第6章 極值目標函數估計
6.1 廣義估計方程估計
6.2 極值目標函數估計
6.3 極值函數估計量的存在性與可測性
6.4 幾類重要的極值函數估計
6.5 極值函數估計的相閤性與漸近正態性
6.6 漸近方差估計
6.7 極值函數估計統計推斷:拉格朗日檢驗及置信區間
6.8 主要結果證明
6.9 補充材料
第7章 經驗似然及估計方程
7.1 經驗似然的基本思想及概念
7.2 一維均值經驗似然
7.3 多維均值經驗似然
7.4 估計方程經驗似然推斷
7.5 有偏抽樣經驗似然
7.6 相關研究及拓展
7.7 主要定理的證明
第8章 僞極大似然
8.1 僞極大似然估計及推斷
8.2 分布誤判及僞似然估計
8.3 僞似然估計相閤性的充要條件
8.4 關於僞似然估計的假設檢驗
8.5 小結及討論
8.6 補充材料
……
第9章 估計方程估計的漸近理論
第10章 估計方程的一般思想
第11章 指數族及廣義綫性模型
第12章 縱嚮數據估計方程
第13章 非參數估計方程
第14章 非參和半參局部擬似然估計
第15章 非參數時間序列估計方程方法
第16章 刪失數據下估計方程
第17章 兩樣本估計方程
第18章 光滑經驗似然
第19章 缺失數據估計方程
第20章 缺失數據下分位數迴歸
附錄A 計數過程及其鞅理論
附錄B 非參數迴歸
參考文獻
索引
《現代數學基礎叢書》已齣版書目
前言/序言
估計方程方法是統計推斷中最為普通但同時也是非常有用的統計推斷方法之一,其思想和方法廣泛應用於生存分析、生物統計、工程統計、管理統計、計量經濟學,以及金融計量學等學科領域中,本書著重討論參數模型、時間序列模型、非參數模型、半參數及變係數模型等模型中有關估計方程的統計推斷方法,並討論幾種現代統計學中經常遇到的數據類型下的估計方程估計方法。這些是目前較新的統計推斷方法,主要包括最為常見的獨立樣本、時間序列樣本、縱嚮數據、刪失數據、缺失數據等復雜數據下的估計方程估計方法。一般地,估計方程的估計可以看作為最大似然估計和矩估計方法等古典概率統計推斷方法的推廣,並涉及GMM估計、擬似然估計、僞似然估計和廣義最小二乘估計、經驗似然估計等。結閤各種數據類型和相適應的統計模型,深入地展示這些統計推斷的理論和方法以及它們在實際中的應用,本書理論與實踐相結閤,靈活地運用估計方程方法,使學習者能夠在學習本書的過程中,發現統計方法的奇妙和無窮魅力,同時能通過掌握這些方法使學習者能在較短的時間裏追上國際前沿,以及熟練地應用這些方法,甚至在統計學的方法及理論上進行創新研究。
本書主要涉及概率統計、生存分析、生物醫學統計、計量經濟學和金融風險管理等常用的統計模型及其方法,本書總結瞭一係列應用估計方程估計方法進行統計推斷的統計模型,並概括瞭可以應用一般估計方程估計方法處理的復雜數據。書中除瞭常用的傳統統計推斷方法外,也包括最新的有關估計方程估計的研究成果,
本書適閤大學數理統計專業、數學專業和計量經濟學等專業高年級本科生選修課程,同時也可作為數理統計、統計學以計量經濟學等專業方嚮的研究生基礎課程,另外,本書還適閤各行各業應用數理統計科學工作者和經濟、金融、社會學、心理學、生物醫學和工業工程等專業人士。
全書分為20章,第1章緒論,對全書的內容進行瞭概述,並給齣一些基本結果,以使讀者能很快地瞭解全書的內容和所涉及的理解和方法,第2章和第3章是準備知識,主要介紹一些估計方程方法的相關基礎知識和常用的數據類型,以及統計大樣本的常用極限理論,涉及大數律、中心極限定理,以及一緻大數律等。如果讀者對理論不感興趣,則隻需知道結論而跳過理論證明即可。第4章介紹的Delta方法是一種常用工具,在推斷參數函數估計的大樣本性質時,特彆是漸近方差時,非常有用和有效,
第5章介紹兩種經典的統計方法,即矩估計和極大似然估計方法,這兩種方法在一般的教科書上都有介紹,但並不十分全麵,本書旨在通過更為全麵的介紹,讓讀者對統計推斷方法有更深入的理解,同時,本書的其他章節都是以極大似然估計方法為參照,應用估計方程的過程與應用極大似然估計方法具有相似性,首先是參數估計,其次構造置信區間或進行假設檢驗,理論結果也類似,當然不同數據類型和模型下結論各異,但是,掌握瞭最基礎的極大似然估計將有助於理解書中其他復雜的方法。另外本章還介紹瞭一些復雜數據下的極大似然估計,
第6章的極值目標函數估計方法是估計方程估計方法的一般化,但它有獨立的意義,因此,有關極值目標函數估計可自成一章,讓讀者能夠很容易掌握處理估計方程的一般方法。在第9章將提供一些選擇最優估計函數的框架和方法,
第7章介紹瞭經驗似然估計方法及其在估計方程中的統計推斷問題,經驗似然方法是處理過識彆估計方程組最有力的兩種工具之一,本章也介紹瞭一些較新的復雜數據下的經驗似然方法,感興趣的讀者如果學習完這章,已足夠進入統計的研究前沿,並能進行相關的研究工作。
第8章是極大似然方法的擴展——僞似然方法,擬似然方法不像極大似然方法需要知道真實的分布函數,從而避免或減小瞭模型誤判的問題,擬似然方法是處理估計方程問題的一種重要方法,其思想具有一般性,
第9章介紹瞭廣義估計方程估計方法及這些估計良好的大樣本性質,還討論瞭廣義估計方程估計的最優方差,即最優估計方程等問題,本章總結瞭最優估計函數的思想及方法,它是本書的重要基礎之一。
第10章是估計方程方法的一般思想,是本書的重點之一,討論瞭如何構造無偏估計函數來獲得估計方程,並通過幾個實用的模型來理解利用廣義估計方程估計方法建模的問題,同時也涉及瞭最優估計方程的一般思想。本章還重點探討瞭生存分析中幾類重要模型構造估計方程的思想方法,並指齣估計方程方法在生存分析中具有廣泛的應用。
第11章討論瞭廣義綫性模型的一般理論和估計方法,簡單介紹瞭指數分布族及在指數分布族下廣義綫性模型的極大似然估計,以及在非指數族分布族下,給齣瞭廣義綫性模型中參數的擬極大似然估計,並討論瞭擬極大似然估計與估計方程的關係,
第12章討論瞭縱嚮數據下的估計方程方法。利用估計方程估計方法可以有效處理縱嚮數據的相關性,並給齣工作方差對估計的影響。
第13章介紹瞭很廣泛的一類非參數估計方程,可以包括半參數模型、變係數模型等,主要通過局部光滑技術有效地得齣參數或非參數的估計方程估計。這裏給齣瞭非參數估計方程的統計推斷的一般方法,並應用於一個重要的實際例子中。
好的,這是一份關於《現代數學基礎叢書·典藏版:廣義估計方程估計方法》的圖書簡介,內容詳實,聚焦於該領域的核心理論與實踐應用,旨在為讀者勾勒齣該書的知識架構與學術價值。 --- 現代數學基礎叢書·典藏版:廣義估計方程估計方法 導論:統計推斷的基石與模型選擇的挑戰 本書深入探討瞭統計學和計量經濟學領域中一類強大而靈活的估計工具——廣義估計方程(Generalized Estimating Equations, GEE)方法。在經典迴歸分析(如最小二乘法或極大似然估計)的框架下,我們通常需要對數據的分布做齣強烈的假設,尤其是針對殘差或誤差項的獨立性和同方差性。然而,在麵對現實世界中大量復雜數據結構時,這些假設往往被打破。 本書聚焦於處理縱嚮數據(Longitudinal Data)、聚類數據(Clustered Data)以及其他形式的非獨立觀測數據。在這些場景下,同一研究對象或同一聚類內部的觀測值之間存在著顯著的內部相關性(或稱作組內相關性)。如果忽視這種相關性而采用傳統方法進行估計,得到的標準誤(Standard Errors)將會是有偏的,從而導緻推斷結論的可靠性大打摺扣,甚至得齣錯誤的統計顯著性判斷。 GEE方法正是在這種背景下應運而生,它提供瞭一種無需精確指定誤差項的協方差結構,就能獲得一緻且漸近正態的參數估計值。本書的價值在於,它不僅係統梳理瞭GEE方法背後的嚴謹數理基礎,更側重於其在實際統計建模中的操作細節與應用潛力。 第一部分:理論基石——從普通最小二乘到非獨立數據的拓展 本書的開篇部分,著重於奠定讀者理解GEE方法的數學基礎。首先,它迴顧瞭經典綫性模型(CLM)和極大似然估計(MLE)的核心思想,強調瞭獨立同分布(i.i.d.)假設的重要性及其局限性。 隨後,引入矩估計(Method of Moments)的概念,這是GEE方法的理論源頭。GEE的本質是構建一組評分函數(Score Functions)或矩條件,使得這些函數在總體上期望值為零。通過求解這些方程組,我們可以得到參數的估計量。 關鍵概念的深入闡述包括: 1. 估計方程的構造: 詳述瞭如何根據數據結構構建估計方程。在GEE框架下,參數估計量 $eta$ 滿足以下形式的矩方程: $$ sum_{i=1}^{N} left[ frac{partial mu_i}{partial eta}
ight]^T V_i^{-1} (Y_i - mu_i) = 0 $$ 其中,$mu_i$ 是均值函數(依賴於迴歸因子 $mathbf{X}_i$ 和待估參數 $eta$),而 $V_i$ 則是錶示觀測值內部相關性的“工作”協方差矩陣(Working Covariance Matrix)。 2. “工作”協方差矩陣的角色: 強調GEE方法最大的優勢在於其對 $V_i$ 的選擇具有極大的魯棒性。即使我們對 $V_i$ 的結構指定錯誤(即“工作”結構與真實結構不符),隻要估計方程的其餘部分是正確的,參數估計 $hat{eta}$ 仍然是一緻的(Consistent)。本書詳細對比瞭五種常用的工作結構:獨立結構、對角結構、復閤對稱結構、AR(1)結構以及自定義結構,並討論瞭在信息缺失時如何選擇最穩健的結構。 3. 穩健標準誤(Robust Standard Errors)的推導: 相比於參數估計本身,GEE方法最關鍵的貢獻在於其擬最大似然(QML)意義下的穩健協方差矩陣估計(即“Sandwich”估計器)。本書詳細推導瞭這一估計量的具體形式,揭示瞭其如何校正因模型誤設導緻的估計方差誇大或縮小問題,從而保障統計推斷的有效性。 第二部分:應用實踐——縱嚮數據與聚類分析的精確建模 本書的第二部分轉嚮實際應用,重點展示GEE方法如何高效解決生物醫學、社會科學和市場營銷中的核心問題。 2.1 縱嚮數據的處理與時間依賴性 在醫學試驗或麵闆數據分析中,研究對象在多個時間點被重復測量。GEE方法在此處展現齣優於標準重復測量方差分析(ANOVA)或標準綫性混閤模型(LMM)的靈活性。 時間依賴性建模: 詳細介紹瞭如何利用GEE處理不同時間點之間的相關性。例如,對於一個有 $T$ 個時間點的研究,復閤對稱結構假設所有時間點之間的相關係數 $
ho$ 相同,而AR(1)結構則假設相關性隨時間間隔的增大而減小。 效應的解釋: 討論瞭GEE估計的迴歸係數(如 $eta_1$)的解釋——它們通常代錶瞭“平均效應”或“總體平均響應”,與混閤模型中關注的“個體特定效應”有所區彆。 2.2 聚類數據的異質性與非獨立性 當數據按自然群組(如學校、醫院、傢庭)聚類時,GEE同樣適用。 群組內相關性建模: 闡述瞭如何使用GEE處理非嵌套的聚類數據。重點分析瞭當集群大小不一時,如何通過正確的加權和迭代過程確保估計的準確性。 對特定模型的適用性: 雖然本書重點討論綫性模型下的GEE(即Liang & Zeger, 1986),但也擴展介紹瞭泊鬆GEE(用於計數數據)和Logit/Probit GEE(用於二元或比例數據)的應用。例如,在分析某地區不同醫院的感染率時,由於患者的治療方案和護理質量在醫院內部是相關的,GEE能夠提供可靠的醫院間差異估計。 第三部分:進階議題與方法論的比較 為瞭使讀者能夠全麵掌握GEE方法的地位和局限,本書的最後部分進行瞭深入的方法論探討。 3.1 模型選擇與信息準則的局限性 GEE方法的一個重要特點是,它不直接提供基於似然的優度檢驗,因為其基於的工作協方差結構通常是錯誤的。本書詳細討論瞭如何評估模型擬閤優度: 擬閤信息準則(GEE-based Information Criteria): 介紹瞭修正的準則,如QIC (Quasi-likelihood Information Criterion),該準則在標準AIC/BIC的基礎上,加入瞭對協方差矩陣誤設所導緻的額外懲罰項,從而更閤理地在模型復雜度和擬閤度之間進行權衡。 殘差分析: 強調瞭對標準化殘差進行結構化分析的重要性,即使是穩健估計,也不能完全替代對模型假設的審視。 3.2 GEE與混閤模型(LMM/GLMM)的對比 這是統計建模中的一個經典問題。本書清晰地劃分瞭GEE和混閤效應模型的使用場景: GEE的優勢(群體焦點): 適用於關注總體平均效應,且對協方差結構不確定性較大的情況。其估計量對協方差結構誤設具有高度穩健性。 混閤模型的優勢(個體焦點): 適用於需要關注個體間異質性(隨機效應)或需要進行個體水平預測的場景。混閤模型提供瞭對協方差結構的更完整、更詳細的描述。 3.3 迭代算法與計算實現 本書最後提供瞭GEE估計實現所需的迭代算法步驟,通常采用牛頓-拉夫遜法或迭代重加權最小二乘法(IRLS)的變體。詳細展示瞭如何交替更新參數估計 $eta$ 和工作協方差矩陣 $V_i$ 直至收斂。 總結 《現代數學基礎叢書·典藏版:廣義估計方程估計方法》是一部麵嚮高級統計學、計量經濟學和生物統計學研究者的專著。它不僅是理論探索的深度指南,更是處理復雜、非獨立數據結構的實踐手冊。通過本書,讀者將掌握一種無需過度依賴嚴格分布假設,即可獲得可靠統計推斷的強大工具,從而提升其在處理真實世界復雜數據集時的分析能力與洞察力。本書的典藏價值在於其對方法論的嚴謹闡述和對實際操作細節的詳盡覆蓋,是統計學方法論領域不可或缺的參考資料。