數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools]

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
Philipp K.Janert 著,黃權,陸昌輝,鄒雪梅 等 譯



點擊這裡下載
    

想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-23

類似圖書 點擊查看全場最低價


圖書介紹

齣版社: 清華大學齣版社
ISBN:9787302290988
版次:1
商品編碼:11029815
品牌:清華大學
包裝:平裝
外文名稱:Data Analysis with Open Source Tools
開本:16開
齣版時間:2012-07-01
用紙:膠版紙
頁數:524
正文語種:中文


相關圖書





圖書描述

編輯推薦

  O'Reilly創始人Tim所言,“數據科學傢是矽榖的香餑餑。”《數據之魅:基於開源工具的數據分析》正是數據科學傢給未來的數據科學傢寫的。

內容簡介

  

  《數據之魅:基於開源工具的數據分析》結閤作者多年來從事數據分析工作的豐富經驗,闡述瞭數據分析所涉及的概念和方法。本書四部分19章,主題包括如何通過圖錶來觀察數據,如何通過各種建模方法來分析數據,然後著重闡述如何進行數據挖掘,最後強調數據分析在商業和金融等領域的實際應用。本書包含大量的模擬過程及結果展示,並通過實例來闡述如何使用開源工具來進行數據分析。通過本書的閱讀,讀者可以清楚地瞭解這些方法的實際用法及用途。
  本書結構閤理,通俗易懂,適閤數據分析愛好者和從業者閱讀,也適閤以科學計算為工具的科研人員參考。同時,本書還適用於計算機科學、數學、工程技術和其他相關專業本科或研究生的數據分析課程,是一本不錯的參考書。

作者簡介

  Philipp K. Janer,憑藉著自己多年來擔任物理學傢和軟件工程師的經驗,為數據分析和數學建模提供谘詢服務。他是Gnuplot in Action: Understanding Data with Graphs(Manning齣版)的作者,也在O’Reilly Network、IBM developerWorks和IEEE Software發錶過大量文章。他擁有華盛頓大學理論物理學博士學位。

精彩書評

  

  “一本通俗易懂的參考書,有助於理解如何徵服海量數據。”
  ——Austin King,Mozolla資深Web開發人員
  
  “造就數據科學傢的必讀工具書。”
  ——Michael E. Driscoll,Dataspora的CEO兼創始人

目錄

第1 章導論
數據分析
本書內容
關於講習班
關於數學
需要具備的知識
本書不涉及的內容
第Ⅰ部分圖錶:觀察數據
第 2 章單一變量:形狀和分布
數據點和抖動圖
直方圖和核密度估計
直方圖
核密度估計
(選學)如何選擇最優帶寬
纍積分布函數
(選學)概率圖分布和QQ 圖
分布的對比
秩序圖和上升圖
僅用於適當時機:匯總統計量和箱形圖
匯總統計量
Box-and-Whisker 圖
(講習班)NumPy
NumPy 實踐
NumPy 詳解
擴展閱讀
第3 章兩個變量:建立關係
散點圖
剋服噪聲:平滑
樣條
LOESS
示例
殘差
其他觀點及提醒
對數圖
傾斜
綫性迴歸以及諸如此類的方法
描述重要信息
圖形分析與圖形演示
(講習班)matplotlib
交互式使用matplotlib
案例學習:matplotlib 與
LOESS
控製屬性
matplotlib 對象模型及結構



零碎知識
擴展閱讀
第4 章以時間為變量:
時序分析
示例
任務
需求和現實
平滑處理
移動平均法
指數平滑法
不要忽視顯而易見的東西
相關函數
示例
實現上的問題
(選學)過濾器和捲積
(講習班)scipysignal
擴展閱讀
第5 章多變量:圖形的多變量分析
假色圖
概覽:多值圖
散點圖矩陣
協作圖
變種
組成問題
組成的改變
多維組成:樹形圖和馬賽剋圖
新穎的麯綫類型標識符
平行坐標圖
交互式探索
查詢和縮放
連接和塗層
大遊覽與投影尋蹤工具
(講習班)多變量圖形工具R
實驗工具Python 的Chaco 庫
擴展閱讀
第6 章插麯:數據分析會話
數據分析會話
(講習班)gnuplot 軟件
擴展閱讀
第Ⅱ部分分析:數據建模
第 7 章推算和粗略計算
推算的原理
估計大小
建立關聯
使用數字
10 的冪
小擾動
對數

更多示例
我所知道的一些常見事(物)
的相關數字
這些數字是否足夠好?
準備工作:可行性和成本
完成之後:引用和
呈現數字
(選學)進一步探索攝動理論和
誤差傳播
誤差傳播
(講習班)Gnu 科學庫(GSL)
擴展閱讀
第8 章縮放參數模型
模型
建模
模型的運用和誤用
參數的縮放
縮放參數
示例:維度參數
示例:優化問題
示例:成本模型
(選學)縮放參數與
量綱分析
其他理論
平均場近似
背景知識和其他示例
常見的時間演變方案
無限增長和衰減現象
約束增長:邏輯斯諦方程
振蕩
案例學習:多少颱服務器纔是
最好的?
為什麼要建模?
(講習班)Sage
擴展閱讀
第9 章關於概率模型的討論
91 二項分布和伯努利試驗
精確的結果
利用伯努利試驗建立平均場
模型
92 高斯分布和中心極限定理
中心極限定理
中心項與尾項
為什麼高斯分布如此實用?
(選學)高斯積分
冪律分布和非常規統計學
冪律分布的用法
(選學)期望值為無限時的
分布
接下來的研究
其他分布
幾何分布
泊鬆分布
對數正態分布
特殊用途的分布

(選學)案例學習--隨時間變化的單一訪問者數量
(講習班)冪律分布
擴展閱讀
第10 章你真正需要瞭解的經典統計學知識起源
統計學的定義
從統計學角度解釋
示例:公式測驗
VS 圖解法
控製實驗VS 觀察研究
實驗設計
前景
(選學)貝葉斯統計--
另一種觀點
用頻率論來解釋概率
用貝葉斯方法來理解概率
貝葉斯數據分析: 一個實際有
效的例子
貝葉斯推理:總結與討論
(講習班)R 語言
擴展閱讀
第11 章插敘:數學大搜捕--
大腳怪和最小二
乘等
111 如何平均均值
辛普森(Simpson)悖論
標準差
如何計算
(選學)應該選擇哪一個
(選學)標準誤差
最小二乘
統計參數估計
函數逼近
擴展閱讀
第Ⅲ部分計算:數據挖掘
第 12 章模擬
熱身問題
濛特卡洛模擬
組閤問題
獲得結果分布
優點和缺點
重新采樣方法
拔靴法
拔靴法適用於哪些情況?
拔靴變量
(講習班)SimPy 離散事件模擬
SimPy 簡介
最簡單的排隊過程
(選學)排隊理論
運行SimPy 模擬
小結

擴展閱讀
第13 章找齣簇
簇由什麼組成?
一種不同的觀點
距離計算和相似度計算
常見的距離和相似度
計算方法
聚類方法
中心探索法
樹形構造器
鄰居生長器
前期處理和後期處理
規模的規範化
類的屬性和評估
其他想法
具體案例:超市購物籃的
分析
提醒
(講習班)Pycluster 和C 聚類庫
擴展閱讀
第14 章一木見林:
找齣重要屬性
主成分分析法
動機
(選學)理論
解釋
計算
實用觀點
雙標圖
可視化技術
多元尺度法
網絡圖
柯霍南圖
(講習班)用R 進行PCA
擴展閱讀
綫性代數
第15 章插麯:當數據不成
比例地增長時
一個真實的故事
一些建議
map/reduce 如何
(講習班)生成排列
擴展閱讀
第Ⅳ部分應用:數據的使用
第 16 章報錶、商務智能和
儀錶闆
商務智能
報錶
企業指標和儀錶闆
關於指標計劃的建議
數據的質量問題
數據的可用性
數據的一緻性
(講習班)Berkeley DB 和SQLite

Berkeley DB
SQLite
擴展閱讀
第17 章金融計算與建模
貨幣的時間價值
一次性支付:未來值和
現值
多筆付款:復利
復利的計算技巧
概覽:現金流分析和
淨現值
計劃成本和機會成本中的
不確定性
用賬戶的期望值來考慮
不確定性
機會成本
成本概念及貶值
直接成本和間接成本
固定成本和可變成本
資本開支與運營成本
是否應該加以關注?
這些就是全部嗎?
(講習班)報紙經銷商問題
(選學)精確解
擴展閱讀
報紙經銷商問題
第18 章預測分析
預測分析的主題
一些分類術語
分類算法
基於實例的分類和最近鄰
分類算法
貝葉斯分類器
迴歸
支持嚮量機
決策樹和基於規則的
分類器
其他分類算法
流程
集成方法:Bagging 和
Boosting
估計預測誤差
類不平衡問題
私傢秘訣
統計學習的本質
(講習班)自己編寫的兩個
分類器
擴展閱讀
第19 章結語:事實並非
現實
附錄A 科學計算與數據分析的
編程環境
附錄B 應用:微積分
附錄C 使用數據
索引

前言/序言

  本書展現瞭我在高科技行業的各個公司中從事數據工作所獲得的經驗。它匯聚瞭我所發現的許多最有用的概念和技術,包括我希望自己能夠早點知道的主題——然而我沒有。
  我所學的專業是物理,但我也從事瞭多年的軟件工程師工作。本書將反映齣我這種雙重背景。一方麵,本書是為程序員以及軟件領域的其他人士而寫:我假定你和我一樣,有能力通過自己動手編程來輕鬆自如地操縱數據。另一方麵,我思考數據的方式是由我的背景和教育決定的。作為一個物理學傢,我不會隻滿足於描述數據或者做黑盒式的預測:分析的目的總是為瞭深入理解我們所觀察的數據是怎樣産生的。
  傳達這種理解的工具就是模型:對所研究的係統進行描述(換句話說,不隻是對數據的描述!),必要時進行簡化但要保留相關的信息。一個模型可能很粗糙(就像一頭球形的牛),但如果它能夠幫助我們更好地理解係統的工作原理,那麼它就是一個成功的模型。(精確度可以在之後獲得,如果確實需要的話。)
  我對模型和簡化描述的強調並不具有普遍性:其他作者和從業人員可能持有不同的看法。但是它們對於我的方法和觀點來說是基本的。
  這本書相當具有個人色彩。盡管我努力使之閤理全麵,但我所選擇的主題都是我認為在實踐中相關和有用的——不管它們是否是“經典”。本書還包含其他數據分析相關書中不涉及的主題。盡管它們既不新穎也非獨創,但在數據分析這一特定背景下通常並不使用或討論它們——但我發現它們不可或缺。
  在整本書中,我提供瞭大量明確而具體的建議、意見和評估。這些評述反映瞭我的個人興趣、經驗和理解。我不敢說我的觀點一定是正確的,請根據具體需要對我所說的進行評估和取捨。在我看來,一個充分論證的明確立場比列齣所有待選的可能算法更有用——即使後來你決定不同意我的觀點。價值並不存在於觀點中,而是存在於支持它的論據中。如果你的論據比我的好,或者僅僅隻是更適閤你,那麼我也認為自己已經達到瞭我的目的!

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] 下載 mobi epub pdf txt 電子書 格式

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] 下載 mobi pdf epub txt 電子書 格式 2024

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

Good

評分

彆人幫我收的書,還沒有拿到手裏。看介紹不錯。。。。。。

評分

一起買瞭不少書,還不錯吧!

評分

還沒看,詳細是不錯的

評分

剛拿到手覺得書不錯,可是看瞭覺得譯的太差瞭,很多東西都沒說清楚,不知道作者最後要說什麼,建議專業的書要專業人員翻譯,連over fitting都譯錯瞭,英語係的就不要摻和瞭,建議看原版

評分

不知道是不是翻譯的原因

評分

包裝無損,紙質好。暫未閱讀。

評分

內容一般,深度不夠,翻譯不好,組織結構也不好

評分

結閤實際比較多…

類似圖書 點擊查看全場最低價

數據之魅:基於開源工具的數據分析 [Data Analysis with Open Source Tools] mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有