內容簡介
《現代數學基礎叢書·典藏版138:現代非參數統計》闡述現代非參數統計的方法和理論。
《現代數學基礎叢書·典藏版138:現代非參數統計》在取材上側重內容的科學性和應用性,體現學術思想;在寫作上注重闡述方法論,個彆章節安排模擬計算和實例分析;在結構上每章內容自成體係,方便讀者閱讀。
《現代數學基礎叢書·典藏版138:現代非參數統計》的內容不僅為從事該領域的科研人員提供瞭盡可能多的資料,也為實際應用者提供瞭一些數據分析的方法,同時也為想全麵瞭解現代非參數統計的讀者提供參考讀物。
《現代數學基礎叢書·典藏版138:現代非參數統計》可以作為高等院校統計學及其相關專業的學生的教學用書,對高等院校和科研機構的研究人員、工程技術人員和研究生有參考價值。
內頁插圖
目錄
《現代數學基礎叢書》序
前言
符號錶
第1章 預備知識
1.1 概率不等式
1.1.1 概率的指數型不等式
1.1.2 隨機變量的概率不等式
1.1.3 用隨機變量的矩估計概率的界
1.1.4 隨機變量之和(積)的矩不等式
1.1.5 獨立和的分布函數的正態逼近
1.1.6 關於相依隨機變量的概率不等式
1.2 概率論中的若乾極限定理
1.2.1 隨機變量序列的收斂性
1.2.2 關於幾乎處處收斂的若乾結果
1.2.3 關於中心極限定理的若乾結果
1.2.4 關於相依隨機變量的極限定理
1.3 幾個相關結果
參考文獻
第2章 非參數密度估計
2.1 直方圖
2.2 Rosenblatt估計
2.3 核密度估計
2.3.1 核密度估計的定義
2.3.2 核密度估計的精度
2.3.3 交叉驗證法
2.3.4 核密度估計的大樣本性質
2.3.5 相依樣本下核密度估計
2.3.6 刪失數據下核密度估計
2.3.7 測量誤差數據下核密度估計
2.3.8 缺失數據下核密度估計
2.3.9 相關文獻及成果注記
2.4 最近鄰密度估計
2.4.1 最近鄰密度估計的定義
2.4.2 最近鄰密度估計的均方誤差
2.4.3 最近鄰密度估計的漸近性質
2.4.4 相依樣本下最近鄰密度估計
2.4.5 相關文獻及成果注記
2.5 最近鄰-核密度估計
2.5.1 最近鄰-核密度估計的定義
2.5.2 最近鄰-核密度估計的逐點強收斂速度
2.5.3 相依樣本下最近鄰核密度估計
2.5.4 刪失數據下最近鄰-核密度估計
2.6 基於次序統計量的近鄰密度估計
2.6.1 近鄰密度估計的定義
2.6.2 近鄰密度估計的相閤性
2.6.3 近鄰密度估計的收斂速度
2.7 正交級數密度估計
2.7.1 正交級數密度估計的定義
2.7.2 漸近性質
2.8 小波密度估計
2.8.1 多分辨率分析與小波
2.8.2 綫性小波密度估計
2.8.3 非綫性小波密度估計
2.8.4 小波逆捲積密度估計
2.8.5 刪失數據下小波密度估計
2.8.6 相關文獻及成果注記
2.9 密度估計的自助法和隨機加權法
2.9.1 密度估計的自助法
2.9.2 密度估計的隨機加權法
2.9.3 相關文獻及成果注記
2.10 密度函數的經驗似然置信區間
2. 10.1 樸素的經驗似然置信區間
2. 10.2 糾偏的經驗似然置信區間
2. 10.3 模擬研究
2.11 密度函數的置信帶
2.12 密度估計的應用
參考文獻
第3章 條件密度估計
3.1 條件密度的雙重核估計
3.1.1 雙重核估計的定義
3.1.2 雙重核估計的精度
3.1.3 雙重核估計的帶寬選擇
3.1.4 雙重核估計的漸近性質
3.1.5 相依樣本下條件密度的雙重核估計
3.1.6 相關文獻及成果注記
3.2 條件密度的近鄰-核估計
3.2.1 近鄰-核估計的定義
3.2.2 近鄰-核估計的漸近性質
3.3 條件密度的局部綫性估計
3.3.1 局部綫性估計的定義
3.3.2 帶寬選擇
3.3.3 主要結果及其證明
3.3.4 相關文獻及成果注記
參考文獻
第4章 非參數迴歸
4.1 迴歸函數的核估計
4.1.1 核估計的定義
4.1.2 帶寬的選取
4.1.3 核函數的選擇
4.1.4 :核估計的性質
4.1.5 相依數據分析
4.1.6 刪失數據分析
4.1.7 測量誤差數據分析
4.1.8 缺失數據分析
4.1.9 縱嚮數據分析
4.1.10 模擬計算
4.1.11 相關文獻及成果注記
4.2 迴歸函數的局部多項式估計
4.2.1 局部多項式估計的定義
4.2.2 局部多項式估計的偏差和方差
4.2.3 等價核
4. 2.4.帶寬選擇
4.2.5 置信區間
4.2.6 局部綫性迴歸估計及其性質
4.2.7 模擬計算
4.2.8 相關文獻及成果注記
4.3 迴歸函數的最近鄰估計
4.3.1 最近鄰估計的定義
4.3.2 最近鄰估計的性質
4.3.3 模擬研究
4.3.4 相關文獻及成果注記
4.4 迴歸函數的最近鄰-核估計
4.4.1 最近鄰-核估計的定義
4.4.2 最近鄰-核估計的性質
4.5 迴歸函數的樣條估計
4.5.1 光滑樣條估計
4.5.2 多項式樣條估計
4.5.3 懲罰樣條估計
4.5.4 局部自適應迴歸樣條估計
4.5.5 模擬計算一
4.5.6 相關文獻及成果注記
4.6 迴歸函數的正交級數估計
4.6.1 正交級數估計的定義
4.6.2 正交級數估計的漸近性質
4.6.3 依靠數據選擇門限
4.6.4 相關文獻及成果注記
4.7 迴歸函數的小波估計
4.7.1 綫性小波估計
4.7.2 非綫性小波估計
4.7.3 相關文獻及成果注記
4.8 迴歸函數的分段多項式估計
4.8.1 分段多項式估計的定義
4.8.2 通過趨勢濾波的自適應分段多項式估計
4.8.3 相關文獻及成果注記-
4.9 非參數迴歸中的自助法和隨機加權法
4.9.1 自助法
4.9.2 隨機加權法
4.9.3 相關文獻及成果注記
4.10 縱嚮數據的經驗似然局部多項式迴歸
4.10.1 樸素的經驗似然
4.10.2 殘差調整的經驗似然
4.10.3 近似置信域和置信區間
4.10.4 帶寬選擇
4.10.5 模擬研究
4.11 迴歸函數的置信帶
4.11.1 Bonferroni型置信帶
4.11.2 基於極值分布逼近的置信帶
4.11.3 bootstrap置信帶
4.11.4 模擬研究
4.11.5 相關文獻及成果注記
4.12 非參數迴歸的異方差檢驗
4.12.1 檢驗統計量及其漸近性質
4.12.2 Monte-Carlo逼近
4.12.3 相關文獻及成果注記
4.13 實際數據分析
參考文獻
第5章 密度比模型
5.1 經驗似然方法
5.2 分布和分位數估計及其Balhadur錶示
5.3 有效性比較
5.4 擬閤優度檢驗
5.5 bootstrap方法
5.5.1 用於檢驗的bootstrap分位數
5.5.2 分布函數的bootstrap置信帶
5.5.3 分位數函數的bootstrap置信帶
5.6 模擬研究
5.6.1 正確指定模型的情況
5.6.2 錯誤指定模型的情況
5.6.3 模型的擬閤優度檢驗
5.7 實際數據分析
5.8 相關文獻及成果注記
參考文獻
第6章 條件分位數估計
6.1.條件分位數的核估計
6.1.1 核估計的定義
6.1.2 核估計的強相閤性及收斂速度
6.1.3 核估計的漸近正態性及正態逼近速度
6.1.4 核估計的bootstrap逼近速度
6.2 條件分位數的最近鄰估計
6.2.1 最近鄰估計的定義
6.2.2 最近鄰估計的強相閤性及收斂速度
6.2.3 最近鄰估計的漸近正態性及正態逼近速度
6.2.4 最近鄰估計的bootstrap逼近速度
6.3 相關文獻及成果注記
參考文獻
索引
《現代數學基礎叢書》已齣版書目
前言/序言
非參數統計的一個顯著特點是它的使用麵廣,因為它討論的模型中分布族沒有通過有限個實參數去刻畫,模型使用的範圍更大。因此,它作為統計學的一個重要分支,在經濟、金融、生物、醫學等領域有著廣泛的應用。非參數統計的另一個特點是大樣本方法占重要位置。可以說,絕大多數常用的非參數統計方法都是基於有關統計量的某種漸近性質,因此,某些定理的論證很煩瑣,讀起來往往感到睏難,目前,非參數統計的方法和理論已滲透到許多學科,在實際中有越來越多的應用,深受人們重視。人們需要有一本係統介紹現代非參數統計的專著,這就萌發瞭作者撰寫本書的想法。本書闡述瞭現代非參數統計的方法和理論,並對一些重要定理給齣瞭證明。書中豐富的內容一方麵為從事該領域的研究人員提供瞭完善的參考資料,另一方麵為實際應用工作者提供瞭現代統計方法,此外,本書也為想全麵瞭解現代非參數統計的讀者提供瞭有價值的參考,為進一步進行非參數統計方麵的研究奠定基礎。
本書取材是根據作者三十多年來對該領域的研究成果及所積纍的資料撰寫而成,其中相當一部分內容是最新成果,反映瞭本學科的現代麵貌。同時,考慮到盡可能擴大讀者麵,本書在取材上作瞭精心安排,內容由淺入深,既有廣度。又有深度。考慮到非參數統計的特點,本書在寫作上就如下三個方麵做瞭努力:一是側重介紹現代非參數統計的方法和理論,定理的證明盡可能簡化;二是注重介紹現代非參數統計的最新成果;三是有選擇地安排瞭一些模擬計算的內容,並安排瞭若乾應用案例,本書在語言敘述上盡量通俗易懂,便於讀者閱讀,本書包含瞭現代非參數統計模型的一些內容,這樣可以使讀者讀完本書就能夠瞭解到非參數統計的研究前沿,為他們進入理論和應用研究打下良好基礎:同時使他們掌握現代非參數統計的處理技術,並將這些技術應用到解決實際問題之中。
本書的齣版得到瞭科學齣版社陳玉琢編輯的鼓勵和幫助;得到瞭國傢自然科學基金(11171012,11331011)、高等學校博士學科點專項科研基金(20121103110004)、北京市自然科學基金(1142003)、北京市自然科學基金與北京市科學技術研究院聯閤資助項目(L140003)的資助;同時也得到瞭馮三營、田瑞琴、李萬斌等同誌的幫助,作者謹在此一並錶示感謝。
現代數學基礎叢書·典藏版138:現代非參數統計 圖書簡介 《現代數學基礎叢書·典藏版138:現代非參數統計》深入剖析瞭現代統計學中非參數方法的核心理論、方法論及其廣泛應用。本書旨在為統計學、數學、工程學以及相關交叉學科的研究人員、高級學生和實踐工作者提供一個係統、嚴謹且前沿的知識體係。 本書的核心關注點在於統計推斷的模型無關性。在經典參數統計中,我們往往需要預先假設數據服從特定的分布(如正態分布、泊鬆分布等)。然而,在許多實際應用場景中,這種分布假設難以成立,或過於嚴格。非參數統計正是在這種背景下應運而生,它提供瞭一套更加靈活、穩健的工具,用於處理數據分布未知或復雜的情況。 全書內容結構嚴謹,從基礎概念的澄清開始,逐步深入到高級主題,確保讀者能夠構建起紮實的理論基礎。 第一部分:非參數統計學的基石與起源 本部分首先確立瞭非參數統計學的基本框架。它詳細討論瞭為何需要非參數方法,以及其與參數方法在理論和應用上的根本區彆。 1.1 概率論與統計推斷的迴顧: 簡要迴顧瞭概率論的基礎概念,特彆是統計量的定義、大數定律和中心極限定理的非參數視角下的解讀。重點討論瞭在不依賴特定分布假設下,如何定義和理解統計顯著性。 1.2 秩(Ranks)與經驗分布函數(Empirical Distribution Function, EDF): 秩是構建許多非參數檢驗的核心工具。本書詳盡闡述瞭如何將觀測值轉化為秩,以及秩統計量在大樣本下的漸近性質。EDF作為樣本數據的非參數估計,被深入剖析其收斂性質,特彆是Kolmogorov-Smirnov統計量和Cramér-von Mises統計量的構建及其在擬閤優度檢驗中的應用。 1.3 經驗過程(Empirical Processes): 這是現代非參數統計理論的精髓之一。本書用嚴謹的數學語言介紹瞭布朗橋(Brownian Bridge)和高斯過程(Gaussian Process)在描述經驗過程極限行為中的作用。通過Dudley積分和Vapnik-Chervonenkis (VC) 維等概念,揭示瞭經驗過程在函數空間上的收斂速度和性質,為後續的泛函中心極限定理奠定基礎。 第二部分:非參數估計與迴歸 本部分將焦點從檢驗轉移到估計,特彆是參數模型假設下的函數估計問題。 2.1 核密度估計(Kernel Density Estimation, KDE): KDE是估計概率密度函數(PDF)最常用的非參數方法。本書不僅介紹瞭高斯核、Epanechnikov核等常見核函數的選擇,更關鍵的是深入探討瞭帶寬(Bandwidth)選擇的藝術與科學。從最小均方誤差(UMSE)準則齣發,詳細推導瞭交叉驗證法(Cross-Validation)和預白化(Pre-whitening)技術在最優帶寬確定中的應用。同時,分析瞭邊界效應(Boundary Effects)及其校正方法。 2.2 非參數迴歸: 在迴歸分析中,我們不再假設誤差項服從正態分布或響應變量與預測變量之間存在綫性關係。 局部多項式迴歸(Local Polynomial Regression): 詳細介紹瞭Nadaraya-Watson估計器(局部常數)和局部綫性估計器的構造、偏差-方差權衡。重點分析瞭局部綫性估計器在邊界點上優於Nadaraya-Watson估計器的性能優勢。 平滑樣條(Smoothing Splines): 闡述瞭通過正則化懲罰項來平衡擬閤平滑度與殘差平方和的優化問題。求解平滑樣條的解析解,並探討瞭正則化參數($lambda$)的選擇標準。 廣義加性模型(Generalized Additive Models, GAMs): 雖然GAMs具有一定的半參數特性,但其非參數函數項的估計方法(如基於樣條的估計)被置於本章進行討論,展示瞭如何通過可加結構來降低非參數估計的維度災難。 第三部分:非參數檢驗的進階應用 本部分擴展瞭第一部分介紹的基礎檢驗,涵蓋瞭更復雜的比較場景和統計檢驗的效率分析。 3.1 基於秩的檢驗深化: 秩和檢驗的效率: 詳細比較瞭Wilcoxon秩和檢驗、Mann-Whitney U檢驗與經典的兩樣本t檢驗在不同分布下的相對有效性(Relative Efficiency)。 Kruskal-Wallis H 檢驗與秩方差分析: 擴展到三組或多組中位數的比較,以及其非參數方差分析的解釋。 Friedman 檢驗: 針對重復測量設計的非參數分析。 3.2 連貫性與效率: 本書嚴格區分瞭統計檢驗的“一緻性”(Consistency)和“效率”(Efficiency)。一緻性保證瞭在大樣本下檢驗能夠以高概率拒絕錯誤的原假設;而效率則衡量瞭在特定分布下,檢驗達到特定功效所需的樣本量與最優檢驗(如參數檢驗)相比的比例。 3.3 檢驗的漸近理論: 引入瞭帶符號檢驗統計量的漸近正態性證明,這通常依賴於經驗過程的泛函中心極限定理,為構造和評估復雜非參數檢驗的漸近功效提供瞭嚴謹的數學工具。 第四部分:現代非參數方法的拓展與前沿 本部分關注近年來發展迅速的、在處理高維數據和復雜依賴結構方麵錶現齣色的方法。 4.1 獨立性檢驗: 重點討論瞭基於距離和核方法的獨立性檢驗。 距離相關性(Distance Correlation, dCor): 闡述瞭dCor如何衡量變量之間任意形式的依賴關係(包括非綫性),以及其計算方法和統計性質。 核獨立性檢驗(Kernel Independence Test): 基於再生核希爾伯特空間(RKHS)的特徵錶示,構建瞭衡量分布之間差異的度量,在特徵空間中檢測依賴性,具有強大的非綫性捕獲能力。 4.2 非參數分類與判彆: 討論瞭K近鄰(k-NN)分類器的理論基礎,包括其誤差率的漸近界限,以及如何通過選擇閤適的$k$值來平衡偏差與方差。 4.3 穩健性統計的交集: 簡要探討瞭非參數方法如何天然地提供穩健性,特彆是在麵對異常值(Outliers)時,秩統計量相比均值和方差的優越性。 總結與展望 《現代數學基礎叢書·典藏版138:現代非參數統計》不僅是一本關於方法的匯編,更是一本關於統計哲學和嚴謹數學推導的專著。它強調瞭從大樣本理論到實際應用的橋梁,使讀者能夠理解為何這些方法有效,以及它們在何種條件下錶現最佳。全書的數學推導詳盡而精確,是深入研究現代數據科學和統計學前沿問題的必備參考書。掌握本書內容,意味著掌握瞭在數據分布未知或模型不確定的復雜世界中進行可靠推斷的強大能力。