內容簡介
《數理統計與數據分析(原書第3版)》將現代統計學的重要思想引入數理統計課程中,強調瞭數據分析、圖形工具和計算機技術,並注重統計的實務和應用。《數理統計與數據分析(原書第3版)》內容豐富,幾乎涵蓋瞭所有經典和前沿的概率論與數理統計理論和方法,主要包括概率、隨機變量、聯閤分布、期望、極限定理、抽樣調查、參數估計、假設檢驗、數據匯總、兩樣本比較、方差分析、分類數據分析和綫性最小二乘等。
《數理統計與數據分析(原書第3版)》用真實數據分析瞭實際問題,以此增強讀者對理論的理解;作者將自助方法與傳統的推論性過程結閤起來,增加瞭濛特卡羅方法。此外,為瞭使概念更清晰,書中提供瞭大量的示例,而且還有豐富的習題,以增強讀者的計算能力。
《數理統計與數據分析(原書第3版)》適閤作為統計學、數學、其他理工科專業以及社會科學和經濟學專業高年級本科生和低年級研究生的教材,同時也可供相關領域技術人員參考。
作者簡介
John A. Rice,在加州大學伯剋利分校獲得博士學位,並一直任教於該校統計係,現為該校統計學名譽教授。他是美國數理統計學會成員,發錶過多篇理論和應用統計學論文,其研究興趣集中於海量和需要高強度計算的隨機數據的分析方法。
目錄
第1章 概率
1.1 引言
1.2 樣本空間
1.3 概率測度
1.4 概率計算:計數方法
1.4.1 乘法原理.
1.4.2 排列與組閤
1.5 條件概率
1.6 獨立性
1.7 結束語
1.8 習題
第2章 隨機變量
2.1 離散隨機變量
2.1.1 伯努利隨機變量
2.1.2 二項分布
2.1.3 幾何分布和負二項分布
2.1.4 超幾何分布
2.1.5 泊鬆分布
2.2 連續隨機變量
2.2.1 指數密度
2.2.2 伽馬密度
2.2.3 正態分布
2.2.4 貝塔密度
2.3 隨機變量的函數
2.4 結束語
2.5 習題
第3章 聯閤分布
3.1 引言
3.2 離散隨機變量
3.3 連續隨機變量
3.4 獨立隨機變量
3.5 條件分布
3.5.1 離散情形
3.5.2 連續情形
3.6 聯閤分布隨機變量函數
3.6.1 和與商
3.6.2 一般情形
3.7 極值和順序統計量
3.8 習題
第4章 期望
4.1 隨機變量的期望
4.1.1 隨機變量函數的期望
4.1.2 隨機變量綫性組閤的期望
4.2 方差和標準差
4.2.1 測量誤差模型
4.3 協方差和相關
4.4 條件期望和預測
4.4.1 定義和例子
4.4.2 預測
4.5 矩生成函數
4.6 近似方法
4.7 習題
第5章 極限定理
5.1 引言
5.2 大數定律
5.3 依分布收斂和中心極限定理
5.4 習題
第6章 正態分布的導齣分布
6.1 引言
6.2.2 分布、t分布和F分布
6.3 樣本均值和樣本方差
6.4 習題
第7章 抽樣調查
7.1 引言
7.2 總體參數
7.3 簡單隨機抽樣
7.3.1 樣本均值的期望和方差
7.3.2 總體方差的估計
7.3.3 X抽樣分布的正態近似
7.4 比率估計
7.5 分層隨機抽樣
7.5.1 引言和記號
7.5.2 分層估計的性質
7.5.3 分配方法
7.6 結束語
7.7 習題
第8章 參數估計和概率分布擬閤
8.1 引言
8.2 粒子排放量的泊鬆分布擬閤
8.3 參數估計
8.4 矩方法
8.5 最大似然方法
8.5.1 多項單元概率的最大似然估計
8.5.2 最大似然估計的大樣本理論
8.5.3 最大似然估計的置信區間
8.6 參數估計的貝葉斯方法
8.6.1 先驗的進一步注釋
8.6.2 後驗的大樣本正態近似
8.6.3 計算問題
8.7 效率和剋拉默{拉奧下界
8.7.1 例子:負二項分布
8.8 充分性
8.8.1 因子分解定理
8.8.2 拉奧{布萊剋韋爾定理
8.9 結束語
8.1 0習題
第9章 假設檢驗和擬閤優度評估
9.1 引言
9.2 奈曼{皮爾遜範式
9.2.1 顯著性水平的設定和p值概念
9.2.2 原假設
9.2.3 一緻最優勢檢驗
9.3 置信區間和假設檢驗的對偶性
9.4 廣義似然比檢驗
9.5 多項分布的似然比檢驗
9.6 泊鬆散布度檢驗
9.7 懸掛根圖
9.8 概率圖
9.9 正態性檢驗
9.1 0結束語
9.1 1習題
第10章 數據匯總
10.1 引言
10.2 基於纍積分布函數的方法
10.2.1 經驗纍積分布函數
10.2.2 生存函數
10.2.3 分位數{分位數圖
10.3 直方圖、密度麯綫和莖葉圖
10.4 位置度量
10.4.1 算術平均
10.4.2 中位數
10.4.3 截尾均值
10.4.4 M估計.
10.4.5 位置估計的比較
10.4.6 自助法評估位置度量的變異性
10.5 散度度量
10.6 箱形圖
10.7 利用散點圖探索關係
10.8 結束語
10.9 習題
第11章 兩樣本比較
11.1 引言
11.2 兩獨立樣本比較
11.2.1 基於正態分布的方法
11.2.2 勢
11.2.3 非參數方法:曼恩{惠特尼檢驗
11.2.4 貝葉斯方法
11.3 配對樣本比較
11.3.1 基於正態分布的方法
11.3.2 非參數方法:符號秩檢驗
11.3.3 例子:測量魚的汞水平
11.4 試驗設計
11.4.1 乳腺動脈結紮術
11.4.2 安慰劑效應
11.4.3 拉納剋郡牛奶試驗
11.4.4 門腔分術
11.4.5 FD&CRedNo;
11.4.6 關於隨機化的進一步評注
11.4.7 研究生招生的觀測研究、混雜和偏見
11.4.8 審前調查
11.5 結束語
11.6 習題
第12章 方差分析
12.1 引言
12.2 單因子試驗設計
12.2.1 正態理論和F檢驗
12.2.2 多重比較問題
12.2.3 非參數方法:剋魯斯卡爾{沃利斯檢驗
12.3 二因子試驗設計
12.3.1 可加性參數化
12.3.2 二因子試驗設計的正態理論
12.3.3 隨機化區組設計
12.3.4 非參數方法:弗裏德曼檢驗
12.4 結束語
12.5 習題
第13章 分類數據分析
13.1 引言
13.2 費捨爾精確檢驗
13.3 卡方齊性檢驗
13.4 卡方獨立性檢驗
13.5 配對設計
13.6 優勢比
13.7 結束語
13.8 習題
第14章 綫性最小二乘
14.1 引言
14.2 簡單綫性迴歸
14.2.1 估計斜率和截距的統計性質
14.2.2 擬閤度評估
14.2.3 相關和迴歸
14.3 綫性最小二乘的矩陣方法
14.4 最小二乘估計的統計性質
14.4.1 嚮量值隨機變量
14.4.2 最小二乘估計的均值和協方差
14.4.3.2 的估計
14.4.4 殘差和標準化殘差
14.4.5 ˉ的推斷
14.5 多元綫性迴歸:一個例子
14.6 條件推斷、無條件推斷和自助法
14.7 局部綫性平滑
14.8 結束語
14.9 習題
附錄A 常用分布
附錄B 錶
部分習題答案
參考文獻
前言/序言
前言
本書的目標
這本書反映瞭我對第一門統計學課程的認識,而這對很多學生來說可能是最後的統計課程。
這樣的課程應該包括數理統計的一些經典內容(如似然法),以及描述統計學和數據分析的一些內容,特彆是圖形顯示、試驗設計和復雜的實際應用。它還應該體現齣計算機在統計學中所起的不可或缺的作用。這些主題適當地交織在一起,可以將現代統計學的本質展示給學生。分彆講授兩個主題的課程 || 一個是理論,一個是數據分析,對我來講似乎有點造作。此外,很多學生僅學習一門統計學課程,而沒有時間學習兩門或兩門以上這方麵的課程。
數據分析與統計實踐
為瞭將上述主題融閤在一起,我一直在努力地撰寫一本能夠緊密結閤統計實踐的教科書。隻有分析實際數據,纔能使我們明白形式理論和通俗數據分析方法所扮演的角色。我圍繞著各種問題組織瞭這本書,這些問題都需要使用統計方法來解決,此外書中包含很多實際例子,藉此引入和介紹理論內容。這樣安排的優點是理論構建在寓意深刻的背景內容下,對其逐步補充和加強,與通俗的分析方法結閤在一起。我認為,這種方法是適閤於統計學的,其曆史發展主要是由實踐需要來促進的,而不是抽象或美學的思考。同時,我也沒有迴避學生應該知道的數學內容。
第3 版
本書第1 版於 1988 年問世,第2 版於 1994 年齣版。盡管本書基本的目的和結構沒有改變,但是新的版本反映瞭統計學科的發展,尤其是計算方麵的革新。
這一版最顯著的變動是對貝葉斯推斷的處理。我將最後一章的材料做瞭遷移,分散於之前的各章中,這是由於很多老師很難講授到這一章。現在貝葉斯推斷首先齣現在第3章的條件分布中。然後,在第8章與頻率學派方法同步講解,那裏的貝葉斯方法可以非常自然地解決最大似然估計量。第9章假設檢驗的引言部分現在以貝葉斯公式作為開端,然後再轉嚮奈曼{皮爾遜範式。
這樣做的一個好處是似然比的至關重要性更突齣。在應用中,我強調無信息先驗,說明頻率學派和貝葉斯學派得齣的定性結論具有相似性。
概率論章節新增瞭基因組學和金融統計的例子。這些材料除瞭與相應的主題相關外,還可以很自然地強化基本概念。例如,連接函數 (copulas) 強調瞭邊際分布和聯閤分布之間的關係。其他變動包括第10章探索性數據分析中散點圖和相關係數的介紹,以及第14章中利用局部綫性最小二乘進行非參數平滑的簡介。本版新增瞭將近 100 道習題,主要集中在第7 .14章,同時還包括幾個新的數據集,有些數據集完全可以用於計算機實驗室上機操作。此外, 還修改瞭前麵版本中解釋含糊不清的一些段落。
概要
當然,我們可以從目錄中找到完整的大綱,這裏,我僅僅強調幾點,並指齣教師講授課程時需要取捨的章節內容。
前 6章包含概率論的內容,特彆是與統計學密切相關的內容。第1章以非測度論的觀點介紹概率論的基本內容,以及初等組閤方法。在這一章和其他概率章節中,我盡可能地利用現實世界的例子,而不是使用球與盒子的抽樣模型。
第2章介紹瞭隨機變量的概念。我選擇將離散型和連續型隨機變量放在一起討論,而不是把連續情形推遲到以後再進行介紹。本章介紹瞭幾個常見分布。這樣安排的好處是它能為後麵的章節提供一些討論和介紹的內容。
第3章繼續討論隨機變量,但是轉嚮聯閤分布。教師可以跳過雅可比行列式,這不會有損課程的連續性,因為它們很少在本書的其餘部分齣現。如果教師樂意之後做些迴溯工作,可以在講解時跳過 3.7 節極值和順序統計量的內容。
期望、方差、協方差、條件期望和矩生成函數共同構成第4章。教師可以跳過條件期望和預測,尤其是沒有計劃講解稍後的充分統計量時。這一章之後的部分介紹瞭 ± 方法 (誤差傳播方法),這個方法多次齣現在統計學的章節中。
第5章在非常嚴格的假設條件下證明瞭大數定律和中心極限定理。
第6章匯編瞭與正態分布有關的常用分布,以及利用通常的正態隨機樣本計算所得統計量的抽樣分布。我沒有在此浪費過多的時間,但確實介紹瞭統計學章節所必需的知識點, 學生很有必要學習這些分布。
第7章是有關抽樣調查的內容,以非常規但比較自然的方式導入統計學的研究議題。很多學生在學習抽樣調查內容時感到比較模糊,而恰恰在抽樣調查中很自然地提齣瞭一係列比較特殊的具體統計問題。從曆史上看,抽樣調查涉及瞭很多重要的統計概念,並可以將其用作傳播介質引入在後麵的章節中深入介紹的概念和技術,例如:
作為隨機變量的估計量的思想,具有與之相關聯的抽樣分布。
偏倚、標準誤差和均方誤差的概念。
置信區間和中心極限定理的應用。
通過研究分層估計量揭示試驗設計的概念以及相對效率的概念。
期望、方差和協方差的計算。
抽樣調查不受歡迎的原因之一是其計算十分令人討厭。然而,這種討厭也有其長處,學生可以在這樣的計算中得到鍛煉。教師可以靈活地掌握介紹本章概念的深度。比率估計和分層部分是可選的,初次講授時完全可以跳過,或稍後再講這些概念,這並不影響課程的連續性。
第8章介紹參數估計,它是由擬閤數據的概率律問題引起的,其中介紹瞭矩方法、最大似然方法和貝葉斯推斷方法,同時還介紹瞭效率的概念,證明瞭剋拉默{拉奧不等式。8.8 節介紹瞭充分性的概念及其一些衍生問題。可以跳過剋拉默{拉奧下界和充分性的內容。在我看來,充分性的重要性通常被過度強調瞭。負二項分布的內容也可以跳過。
第9章介紹瞭假設檢驗及其擬閤優度檢驗的應用,這配閤第8章的內容.(這個內容還會在第11章深入討論。)這裏還簡要展示瞭圖方法。如果課時有限,教師可以跳過本章最後的 9.6 節(泊鬆散布度檢驗)、9.7 節(懸掛根圖)和 9.9 節(正態性檢驗)。
第10章介紹瞭幾種描述性方法,其中的很多技術都會在後麵的章節中齣現。本章強調瞭圖方法的重要性,並介紹瞭穩健性的概念。將描述性方法放在本書的後麵似乎有點怪異, 這樣做是因為描述性方法通常有其隨機性的一麵,三章之後再介紹之可以使學生有足夠的基礎知識去研究各種匯總統計量的統計行為(例如,中位數的置信區間)。我在講授課程時,會較早地介紹這部分內容。例如,在抽樣調查實驗中,我讓學生製作抽取樣本的箱形圖和直方圖。教師可以跳過生存函數和危險函數。
第11章介紹瞭兩樣本問題的經典分析方法和非參數方法。假設檢驗的概念第一次齣現在第9章,在此做瞭更深一步的介紹。本章的末尾討論瞭試驗設計並解釋瞭觀測研究的一些內容。
前麵 11章是初級課程的核心,涵蓋瞭估計和假設檢驗的構造理論、圖和描述性方法以及試驗設計的內容。
教師可以自由地選擇第12章到第14章的內容。特彆地,沒有必要按照書中給定的順序講解這些章節。
第12章利用方差分析和非參數技術討論瞭單因子和二因子試驗設計問題。多重比較問題第一次齣現在第11章末,在此進行瞭深入討論。
第13章簡單討論瞭分類數據分析, 介紹瞭齊性和獨立性的似然比檢驗, 並敘述瞭麥剋尼馬爾檢驗。最後,通過前瞻性和迴顧性研究的討論引入瞭優勢比的估計問題。
第14章討論瞭綫性最小二乘。首先介紹瞭簡單綫性迴歸,接著利用綫性代數討論瞭更一般的情形。我選擇運用矩陣代數,但盡可能地將其維持在簡單和具體層麵上,沒有超過初級一學期(每學年分為四學期製度中的一學期) 課程所講授的內容。特彆地,我沒有介紹一般綫性模型的幾何分析內容,也沒有試圖將迴歸和方差分析統一起來。在這一整章中,理論結果伴隨著更多基於殘差分析的定性數據分析步驟。在本章末,我通過局部綫性最小二乘介紹瞭非參數迴歸。
計算機使用和習題解答
計算是現代統計不可或缺的一部分。它是數據分析的本質,可以幫助我們理清基本概念。我的學生使用開源軟件包 R,將其安裝在自己的計算機上就可以使用。也可以使用其他的軟件包,但在這本書中,我沒有討論其他的軟件程序。原書配套的 CD 內容可從華章網站 (www.hzbook.com)下載,其中包括書中涉及的數據。
這本書包含大量的習題,從例行的基本概念強化題到具有一定難度的分析題。我認為習題解答,特彆是非常規的習題,是非常重要的。
緻謝
我要感謝很多人,他們直接和間接地促成瞭第1 版麵世。Richard Olshen、Yosi Rinnot、Donald Vlvisaker、Len Ha。和 David Lane 在教學中使用瞭早期版本,他們提齣很多有益的意見。他們和我自己課堂中的學生提供瞭很多建設性的意見。助教,尤其是 Joan Staniswalis、Roger John-son、Terri Bittner 和 Peter Kim,解答瞭很多習題,發現其中的很多錯誤。很多審稿人給齣瞭有益的建議:Rollin Brant,多倫多大學;George Casella,康奈爾大學;Howard B。Christensen,楊百翰大學;David Fairley,俄亥俄州立大學;Peter Guttorp,華盛頓大學;Hari Iyer,科羅拉多州立大學;Douglas G。Kelly,北卡羅來納大學;Thomas Leonard,威斯康星大學;Albert S。Paul-son,倫斯勒理工學院;Charles Peters,休斯敦大學;Andrew Rukhin,馬薩諸塞大學安默斯特校區;Robert Schaefer,邁阿密大學;Ruth Williams,加州大學聖地亞哥分校。Richard Royall 和 W.G。Cumberland 熱心地提供瞭第7章抽樣調查所使用的數據集。我在休假時有幸在國傢標準局度過瞭愉快的一年,那裏的統計學傢讓我留意到書中其他幾個數據集。我深深地感激編輯 John Kimmel,他的耐心、毅力和信念促成這本書的齣版。
使用過本書第1 版的很多學生和教員給齣瞭坦誠的評論,這極大地影響瞭第2 版的修訂。我要特彆感謝 Ian Abramson、Edward Bedrick、Jon Frank、Richard Gill、Roger Johnson、Torgny Lindvall、Michael Martin、Deb Nolan、Roger Pinkham、Yosi Rinott、Philip Stark 和 Bin Yu。我要嚮無意間遺漏的同仁錶示道歉。最後,我要感謝 Alex Kugushev 在進行修訂時所提供的鼓勵和支持,感謝 Terri Bittner 在校正和解答新的習題時所做的細緻工作。
很多人促成瞭第3 版的問世。我想感謝如下這些審稿專傢:Marten Wegkamp,耶魯大學;
Aparna Huzurbazar,新墨西哥大學;Laura Bernhofen,剋拉剋大學;Joe Glaz,康涅狄格大學;Michael Minnotte,猶他州立大學。我深深地感激很多讀者,他們慷慨地花費大量時間指齣書中的錯誤,並提齣瞭很多改善結構安排之類的良好建議。特彆地,Roger Pinkham 發送瞭很多有益的電子郵件信息,Nick Cox 指齣瞭大量的語法錯誤。Alice Hsiaw 詳細評述瞭第7.14章。我還想感謝 Ani Adhikari、Paulo Berata、Patrick Brewer、Sang-Hoon Cho Gier Eide、John Einmahl、David Freedman、Roger Johnson、Paul van der Laan、Patrick Lee、Yi Lin、Jim Linnemann、Rasaan Moshesh、Eugene Schuster、Dylan Small、Luis Tenorio、Richard De Veaux 和 Ping Zhang。Bob Stine 貢獻瞭金融數據; Diane Cook 提供瞭意大利橄欖油的數據; Jim Albert 提供瞭籃球數據集,很漂亮地解釋瞭迴歸嚮均值的問題; Rainer Sachs 提供瞭可愛的染色質分離數據。我要感謝編輯Carolyn Crockett 堅強的毅力和耐心,使這一版修訂的願望得以實現,還要感謝這個充滿活力且高效的工作團隊。我要嚮無意間
數理統計與數據分析(原書第3版) 下載 mobi epub pdf txt 電子書 格式