編輯推薦
現實工作中,人們常常需要用數據說話。可是,數據自己不會說話,需要人對它進行分析和挖掘纔能找到有價值的信息。概率統計是數據分析的通用語言,是大數據時代預測未來的根基。如果你有編程背景,就能以概率和統計學為工具,將數據轉化為有用的信息和知識,讓數據說話。本書介紹瞭如何藉助計算而非數學方法,使用Python語言對數據進行統計分析。
通過書中有趣的案例,你可以學到探索性數據分析的整個過程,從數據收集和生成統計量,到發現模式和檢驗假設。你還將探索概率分布、概率法則、可視化技術,以及其他許多工具和概念。
這一版內容較第1版有很多改動,並且新增瞭迴歸、時間序列分析、生存分析和分析方法章節,以豐富你的知識。
通過學習本書,你將能夠:
編寫測試代碼深入理解概率論和統計學;
運行實驗檢驗統計行為特徵,如生成服從各種分布的樣本;
通過模擬理解數學上艱澀的概念;
學習貝葉斯估計等實用內容;
用Python從大部分數據源導入數據,不依賴由統計工具清洗的格式化數據;
用統計推理解讀現實世界中的數據。
內容簡介
《統計思維:程序員數學之概率統計(第2版)》是一本以全新視角講解概率統計的入門圖書。拋開經典的數學分析,Downey手把手教你用編程理解統計學。
具體說來,《統計思維:程序員數學之概率統計(第2版)》通過一個案例研究,介紹探索性數據分析的全過程:從收集數據、生成統計信息,到發現模式、驗證假設。同時研究分布、概率規則、可視化和其他多種工具及概念。此外,第2版新增瞭迴歸、時間序列分析、生存分析和分析方法等章節。
作者簡介
Allen B. Downey是富蘭剋林歐林工程學院計算機科學教授,曾執教於韋爾斯利學院、科爾比學院和加州大學伯剋利分校。在加州大學伯剋利分校獲得計算機科學博士學位。Downey已齣版十餘本技術書,包括Think Python、Think Bayes、Think Complexity等。
內頁插圖
目錄
前言 xi
第1 章 探索性數據分析 1
1.1 統計學方法 2
1.2 全國傢庭增長調查 2
1.3 數據導入 3
1.4 DataFrame 4
1.5 變量 6
1.6 數據變換 6
1.7 數據驗證 8
1.8 解釋數據 9
1.9 練習 10
1.10 術語 11
第2 章 分布 13
2.1 錶示直方圖 14
2.2 繪製直方圖 14
2.3 全國傢庭增長調查中的變量 15
2.4 離群值 18
2.5 第一胎 18
2.6 分布概述 20
2.7 方差 21
2.8 效應量 21
2.9 報告結果 22
2.10 練習 23
2.11 術語 23
第3 章 概率質量函數 25
3.1 概率質量函數 25
3.2 繪製PMF 26
3.3 繪製PMF 的其他方法 28
3.4 課堂規模悖論 29
3.5 使用DataFrame 進行索引 31
3.6 練習 33
3.7 術語 34
第4 章 纍積分布函數 35
4.1 PMF 的局限 35
4.2 百分位數 36
4.3 CDF 37
4.4 錶示CDF 38
4.5 比較CDF 39
4.6 基於百分位數的統計量 40
4.7 隨機數 41
4.8 比較百分位秩 42
4.9 練習 43
4.10 術語 44
第5 章 分布建模 45
5.1 指數分布 45
5.2 正態分布 48
5.3 正態概率圖 49
5.4 對數正態分布 51
5.5 Pareto 分布 53
5.6 隨機數生成 56
5.7 為什麼使用模型 56
5.8 練習 57
5.9 術語 59
第6 章 概率密度函數 61
6.1 PDF 61
6.2 核密度估計 63
6.3 分布框架 65
6.4 Hist 實現 65
6.5 Pmf 實現 66
6.6 Cdf 實現 67
6.7 矩 68
6.8 偏度 69
6.9 練習 72
6.10 術語 73
第7 章 變量之間的關係 75
7.1 散點圖 75
7.2 描述關係特徵 78
7.3 相關性 79
7.4 協方差 80
7.5 Pearson 相關性 81
7.6 非綫性關係 82
7.7 Spearman 秩相關 82
7.8 相關性和因果關係 83
7.9 練習 84
7.10 術語 85
第8 章 估計 87
8.1 估計遊戲 87
8.2 猜測方差 89
8.3 抽樣分布 90
8.4 抽樣偏倚 93
8.5 指數分布 93
8.6 練習 95
8.7 術語 95
第9 章 假設檢驗 97
9.1 經典假設檢驗 97
9.2 假設檢驗 98
9.3 檢驗均值差 100
9.4 其他檢驗統計量 101
9.5 檢驗相關性 102
9.6 檢驗比例 103
9.7 卡方檢驗 104
9.8 再談第一胎 105
9.9 誤差 106
9.10 功效 107
9.11 復現 108
9.12 練習 109
9.13 術語 109
第10 章 綫性最小二乘法 111
10.1 最小二乘法擬閤 111
10.2 實現 112
10.3 殘差 113
10.4 估計 114
10.5 擬閤優度 116
10.6 檢驗綫性模型 118
10.7 加權重抽樣 119
10.8 練習 121
10.9 術語 121
第11 章 迴歸 123
11.1 StatsModels 124
11.2 多重迴歸 125
11.3 非綫性關係 127
11.4 數據挖掘 128
11.5 預測 129
11.6 Logistic 迴歸 131
11.7 估計參數 132
11.8 實現 133
11.9 準確度 134
11.10 練習 135
11.11 術語 136
第12 章 時間序列分析 139
12.1 導入和清洗數據 139
12.2 繪製圖形 141
12.3 綫性迴歸 143
12.4 移動平均值 144
12.5 缺失值 146
12.6 序列相關 148
12.7 自相關 149
12.8 預測 150
12.9 參考書目 154
12.10 練習 154
12.11 術語 155
第13 章 生存分析 157
13.1 生存麯綫 157
13.2 危險函數 159
13.3 估計生存麯綫 160
13.4 Kaplan-Meier 估計 161
13.5 婚姻麯綫 162
13.6 估計生存函數 163
13.7 置信區間 164
13.8 群組效應 166
13.9 外推 168
13.10 預期剩餘生存期 169
13.11 練習 171
13.12 術語 172
第14 章 分析方法 173
14.1 正態分布 173
14.2 抽樣分布 174
14.3 錶示正態分布 175
14.4 中心極限定理 176
14.5 檢驗CLT 177
14.6 應用CLT 180
14.7 相關檢驗 181
14.8 卡方檢驗 183
14.9 討論 184
14.10 練習 184
作者介紹 186
封麵介紹 186
前言/序言
統計思維:程序員數學之概率統計(第2版) 下載 mobi epub pdf txt 電子書 格式
評分
☆☆☆☆☆
我為什麼喜歡在京東買東西,因為今天買明天就可以送到。我為什麼每個商品的評價都一樣,因為在京東買的東西太多太多瞭,導緻積纍瞭很多未評價的訂單,所以我統一用段話作為評價內容,省時省力,還能得京東豆。總而言之、言而總之,在京東買東西又好又快!我為什麼喜歡在京東買東西,因為今天買明天就可以送到。我為什麼每個商品的評價都一樣,因為在京東買的東西太多太多瞭,導緻積纍瞭很多未評價的訂單,所以我統一用段話作為評價內容,省時省力,還能得京東豆。總而言之、言而總之,在京東買東西又好又快!
評分
☆☆☆☆☆
書買來瞭,感覺是正版,要好好研讀咯
評分
☆☆☆☆☆
京東的書肯定不會有問題,發貨速度快,包裝質量好,還可以開發票,這都是其他網站比不瞭的
評分
☆☆☆☆☆
內容不錯,封麵不太好看。
評分
☆☆☆☆☆
初步接觸計算機, 程序員的數學,看我能不能用已知的數學知識學會編程。
評分
☆☆☆☆☆
剛買瞭,還沒看,應該不錯吧,等下試試
評分
☆☆☆☆☆
gooooood
評分
☆☆☆☆☆
好書好書好書好書好書好書好書好書好書好書好書好書
評分
☆☆☆☆☆
很完美,講解很透徹,以前難解的問題都可以解決瞭