發表於2024-11-22
大嘴巴帶你玩轉數據挖掘
讓你知道啤酒君和尿布君為什麼會相遇,大數據的小科普讓你成為"讀心"魔法師!
數據挖掘私人定製 輕鬆掌控再無敵手
拒絕枯燥越過三境 火爆網絡瘋狂下載
《大嘴巴漫談數據挖掘(全彩)》從基本的概率統計學開始,全麵、係統、形象而又深入地描述瞭數據挖掘的基礎概念、應用領域以及常用算法。其中每一種數據挖掘算法都輔以通俗易懂的實例,讀者能夠在直觀性、趣味性中學習算法的具體流程,明白算法的實現過程。通過《大嘴巴漫談數據挖掘(全彩)》的學習,讀者可以對數據挖掘的概念、應用和算法技術有一個清晰的理解和認識,並可以熟悉相關統計學的基本原理。
《大嘴巴漫談數據挖掘(全彩)》適閤想從事數據挖掘方麵的工作的初學者、數據分析愛好者、分析師,以及一綫的數據挖掘開發人員參考閱讀,也適閤客戶經理針對如何開展針對性的營銷活動,避免客戶流失而閱讀學習,更適閤産品經理閱讀,因為針對如何預測産品的目標用戶,促進用戶活躍和業務有效使用,靠經驗已經不行瞭,數據纔有說服力,更適閤企業管理者將其作為一本通俗易懂的數據挖掘基礎讀物閱讀學習,對下屬的工作方嚮給予指導,以及適閤教師學生數據挖掘課程輔導之用。
易嚮軍,北京科技大學計算機碩士學曆,長期工作於互聯網和電信領域,目前創辦dazui8.com,緻力於數據挖掘知識的宣傳推廣以及相關技術的研發探索。關注公眾號:dazui8bbs 與作者互動並收聽免費在綫配套講座。一圖一話韆層意,韆問韆題一片情。有情有意!
★既有漫畫小插圖,又有七絕或者七律打油詩,相當的簡明易懂啊。多次齣場的啤酒君和尿布君,相當有喜感。但是看著看著就變成瞭概率統計教科書瞭有木有——貝葉斯、高斯。多希望我在考研前看到這本書啊,會對我的數學考試有幫助吧!
——展展
★看瞭這本書,確有解惑醒腦之功效,作者很明白我們這些科技小白的理解能力,不敢把話說得太專業,確實通俗易懂,深入淺齣,層層推進,讓初學者都有很強的興趣學進去,對隻想做瞭解的同學來說也不難接受,算是很好的科普作品瞭。
——大雄不貳
★漫談類,減少瞭大數據的枯燥,感覺看一遍還不能及時消化,有空再慢慢精讀一下。
——楊旭彬
★把數據挖掘寫得深入淺齣,很容易讀懂,實用性強。
——傅誌華
★書中關於數據挖掘章節的介紹,我特彆喜歡,畢竟在數據爆炸的今天,隻有從數據中找到彆人沒發現的亮點纔是關鍵。
——由子木
★這本書非常值得每一個對數據感興趣的人士細細研讀!
——李洪宇
★很是喜歡易老師的這種寫書風格,可以讓我們輕鬆地學到知識,超贊!
——駱彬
★把復雜的統計知識和數據挖掘算法用圖形化後,就很適閤作為科普型的數據挖掘入門書籍,好乾貨!
——麒程
★比較簡單,每個點都可以自行擴展學習,就像個全麵的大字典目錄一樣,通讀此書後,可以很好地把握常規的數據挖掘知識和思想。
——金石頭
★總體來說通俗易懂,有一些總結和圖片很有助於理解,總之是能把數據挖掘這種相對枯燥的東西讓人讀下去,這樣來說總體是非常不錯的。
——Woozy
第一境 昨夜西風凋碧樹。獨上高樓,望盡天涯路……
1.1數據挖掘簡介
開篇點題引五問
大數據中求價值
定義概述歸特點
知識決策跨領域
架構特徵多形式
數據立方展多維
功能挖掘四大類
分類刻畫類標識
數據聚類辨親疏
預測未來訓模型
關聯源自購物籃
模型過程方法論
十大算法成經典
1.2數據挖掘應用
行業推廣多應用
用戶為王放心中
指導運營全周期
定位目標尋用戶
精準營銷成閉環
交叉産品有關聯
細分用戶刻畫像
用戶體驗模型化
指標評測建體係
流失預警保用戶
跟蹤評估驗效果
第二境 衣帶漸寬終不悔,為伊消得人憔悴……
2.1概率定義
浮生難料盡偶然
一枚硬幣拋正反
引齣隨機小試驗
樣本空間樣本點
事件三分包萬象
試驗頻率需頻繁
次數無限值極限
描述概率定特點
古典概型等可能
事件B後A在前
求齣概率稱條件
獨立事件A和B
抽簽中奬公平性
常用概率兩公式
交空並全劃樣本
綜閤狀態全概率
前因後果貝葉斯
2.2隨機變量
隨機試驗數量化
統計規律雙類型
離散變量分布律
硬幣拋擲是一零
分布函數連續型
函數求導得密度
高斯分布稱正態
標準正態分位點
2.3數字特徵
隨機變量有特徵
平均取值是期望
方差衡量偏離值
標準開根同量綱
變量關係協方差
相關係數相關度
研究總體要抽樣
抽樣分布統計量
2.4參數估計
最小二乘估參數
極大似然大概率
區間估計置信度
2.5假設檢驗
總體假設來檢驗
服從正態抽樣本
統計量中驗假設
棄真取僞兩錯誤
顯著檢驗小概率
小概率中拒絕域
檢驗流程齣決策
已知總體方差值
檢驗中驗均值
第三境 眾裏尋她韆百度,驀然迴首,那人卻在,燈火闌珊處。
3.1關聯規則
購物籃中找關聯
數據事務若乾項
事務空間含項集
置信支持提升度
規則源於頻繁項
k項連接和剪枝
生成非空規則集
關聯效果來評估
3.2決策樹
決策思維成樹形
分類預測工作流
原理基於信息熵
信息增益條件熵
節點拆分選特徵
3.3貝葉斯
預測分類貝葉斯
類彆概率要最大
分類數據新預測
3.4聚類分析
物以類聚人以群
樣本變量定矩陣
R型Q型換空間
距離度量相似度
係數聚類統計量
標準樣本選歐氏
層次聚閤歸大類
3.5神經網絡
神經網絡神經元
神經元中有加權
輸入映射輸齣層
求齣誤差調參數
權重偏置學習率
實例分析模型流
3.6綫性迴歸
研究身高引迴歸
單自變量歸一元
最小二乘估迴歸
數據差異總離差
分為解釋和誤差
判定係數擬閤度
多元迴歸建方程
迴歸麵中展二元
求得迴歸係數解
衡量擬閤驗效果
3.7邏輯迴歸
因變量中二分類
二項邏輯迴歸式
極大似然解方程
預測分類符閤率
3.8因子分析
相關變量納因子
因子構造築模型
因子載荷統計性
衡量信息共同度
方差貢獻重要性
因子分析四步麯
構造因子求載荷
鏇轉因子得命名
因子組閤求得分
3.9信度分析
設計問捲來調研
信度檢驗可靠性
3.10效度分析
結構方程協方差
測量模型內外生
結構模型潛變量
效度分析路徑圖
提齣假設依理論
固定負荷識模型
相關陣中估參數
數據挖掘,作為大數據時代的關鍵技術及核心內容,其應用價值與日俱增。本書希望能夠成為一本涵蓋最廣泛讀者受眾的科普型數據挖掘入門讀物,並傳遞一種知識圖形化的書寫理念,以圖形化的展現、言簡意賅的語言、通俗易懂的實例來描述復雜的概率統計知識和數據挖掘常用算法,使得讀者在新穎性、趣味性和直觀性中讀完本書後,對於數據挖掘的整體架構和關鍵知識點有所理解和掌握。復雜問題的圖形簡約化錶示是本書的主要特點。
為什麼要寫作本書
一般來說,學習數據挖掘要求讀者已經具備一定的專業水平和相關技能。本書從最基本的概率統計開始,由淺入深,由易到難,由總到分,使得普通讀者也能夠瞭解和掌握常規的數據挖掘理論和知識。
管理者:雖不用到一綫從事具體的數據分析工作,但也需要一本通俗易懂的數據挖掘基礎讀物,通過學習能夠對下屬的工作方嚮給予指導。
客戶經理:如何開展針對性的營銷活動,避免客戶流失,這都需要數據挖掘知識。
産品經理:如何促進産品的用戶活躍和業務的有效使用,不僅要靠經驗,數據纔最有說服力。
工程師:一綫的數據挖掘開發人員必然要掌握的。
分析師:撰寫經營分析報告數據挖掘知識必不可少。
教師:數據挖掘的參考書。
學生:想從事數據分析和挖掘方麵的工作,肯定是要學習的。
數據分析愛好者:一本通俗易懂的入門讀物。
本書主要內容
本書基本上涵蓋瞭學習數據挖掘需要掌握的大部分核心知識點,分為三境17章。第一境總體介紹數據挖掘概況和應用領域,第二境講解基本概率統計知識,第三境具體描述瞭數據挖掘常用的十大算法。
緻謝
本書的順利齣版離不開電子工業齣版社博文視點編輯老師們的辛勤工作,在此錶示最誠摯的感謝!
同時,對於本書的創作形式和書寫理念,本書的齣版人孫學瑛女士給予瞭最大的支持和保留,並提供瞭大量的指導和幫助。衷心感謝孫老師對本書的重視和欣賞,以及為本書齣版所做的一切,並將終身難忘!
由於作者水平有限,書中不足及錯誤之處在所難免,敬請專傢和讀者給予批評指正。
易嚮軍
2014年3月
大嘴巴漫談數據挖掘(全彩) 下載 mobi pdf epub txt 電子書 格式 2024
大嘴巴漫談數據挖掘(全彩) 下載 mobi epub pdf 電子書書包裝好,是正品!快遞到貨快,不錯!
評分感覺一般,需要較好的數學和統計基礎,而且插圖的設計都是什麼鬼啊! 濃重的過時PPT的感覺。
評分就開瞭交離開就能看見瞭
評分淺顯易懂。。。
評分生動的演說適閤初學者。。
評分很不錯很不錯很不錯很不錯很不錯很不錯很不錯
評分內容不錯
評分這書很好
評分圖文並茂,適閤外行對數據挖掘做簡單的瞭解。
大嘴巴漫談數據挖掘(全彩) mobi epub pdf txt 電子書 格式下載 2024