發表於2024-11-05
業內資深專傢十餘年實戰經驗總結,從上韆個真實案例中精選齣18個案例,幫助讀者迅速成長為真正的數據分析與挖掘高手!
初學者的入門嚮導,進階者的成纔之路,實戰專傢的案例指南。
“做中學”是學習統計分析的優路徑,翔實的案例,豐富的細節,助你快速上手數據分析!
《IBM SPSS數據分析與挖掘實戰案例精粹》以ibm spss statistics 20.0和ibm spss modeler 14.1為工具,提供瞭醫療、金融、保險、汽車、快速消費品、市場研究、互聯網等多個行業的數據分析/挖掘案例,基於實戰需求,詳細講解整個案例的完整分析過程,並將模型和軟件的介紹融於案例講解之中,使讀者在閱讀時能突破方法和工具的局限,真正聚集於對數據分析精髓的領悟。《IBM SPSS數據分析與挖掘實戰案例精粹》所附光盤包括案例數據和分析程序/流文件,讀者可完整重現全部的分析內容。
《IBM SPSS數據分析與挖掘實戰案例精粹》適閤從初學者到專傢各個級彆的數據分析人員閱讀,尤其適閤於以下讀者群:需要提升實戰能力的數據分析專業人員;在市場營銷、金融、財務、人力資源管理中需要應用數據分析的人士;從事谘詢、科研等工作的專業人士;同時也適閤於各專業的本科和研究生作為學習數據分析應用的參考書。
張文彤 博士,數據挖掘、市場研究、統計軟件教學與應用領域專傢,現任全球第八大市場研究集團INTAGE中國公司全國技術總監。曾在復旦大學任教數載,期間協助SPSS在中國建立並完善瞭其培訓體係,是國內知名的SPSS培訓師之一。在數據挖掘、市場研究、醫藥數據分析等領域均經驗豐富,曾負責為知名跨國公司完成瞭中國城市女性市場細分模型、銷量預測模型、商圈選址模型等各類項目,並協助完成多項IT、電信、稅務、銀行等行業的數據挖掘項目。
鍾雲飛 資深數據分析專傢,擁有超過10年的統計分析與數據挖掘在各行業的軟件應用及谘詢經驗,曆任SPSS、SAS軟件公司首席谘詢顧問,目前在國際商業機器(中國)有限公司軟件部工作,從事SPSS軟件企業應用的推廣工作。主要關注統計分析與數據挖掘在銀行、電信、政府、保險、零售等行業的應用實踐,緻力於使用數據分析方法幫助企業和政府組織從數據中獲取有價值的信息,從而提高管理水平
第一部分 spss數據分析基礎
第1章 數據分析方法論簡介
1.1 三種數據分析方法論
1.2 crisp-dm方法論介紹
第2章 數據分析方法體係簡介
2.1 統計軟件中的數據存儲格式
2.2 數據的統計描述與參數估計
2.3 常用假設檢驗方法
2.4 多變量模型
2.5 多元統計分析模型
2.6 智能統計分析/數據挖掘方法
第3章 ibm spss statistics操作入門
3.1 案例背景
3.2 數據文件的讀入與變量整理
3.3 問捲數據分析
3.4 項目總結和討論
第4章 ibm spss statistics操作進階
4.1 案例背景
4.2 問捲錄入
4.3 問捲質量校驗
4.4 問捲數據分析
4.5 項目總結和討論
第5章 ibm spss modeler操作入門
5.1 ibm spss modeler概述
5.2 ibm spss modeler相關操作與技巧
5.3 ibm spss modeler功能介紹
5.4 案例分析:藥物選擇決策支持
5.5 如何進一步學習ibm spss modeler
第二部分 影響因素發現與數值預測
第6章 酸奶飲料新産品口味測試
研究案例
6.1 案例背景
6.2 數據理解
6.3 不同品牌的評分差異分析
6.4 兩因素方差分析模型分析
6.5 分析結論與討論
第7章 偏態分布的激素水平影響因素分析
7.1 案例背景
7.2 數據理解
7.3 對因變量變換後的建模分析
7.4 秩變換分析
7.5 利用cox模型進行分析
7.6 項目總結與討論
第8章 某車企汽車年銷量預測案例
8.1 案例背景
8.2 數據理解
8.3 變量變換後的綫性迴歸
8.4 麯綫擬閤
8.5 利用非綫性迴歸進行擬閤
8.6 項目總結與討論
第9章 腦外傷急救後遲發性顱腦損傷影響因素分析案例
9.1 案例背景
9.2 數據理解
9.3 構建二分類logistic迴歸模型
9.4 利用樹模型發現交互項
9.5 使用廣義綫性過程進行分析
9.6 項目總結與討論
第10章 中國消費者信心指數影響因素分析
10.1 案例背景
10.2 數據理解
10.3 標準glm框架下的建模分析
10.4 多元方差分析模型的結果
10.5 最優尺度迴歸
10.6 多水平模型框架下的建模分析
10.7 項目總結與討論
第三部分 信息濃縮、分類與感知圖呈現
第11章 探討消費者購買保健品的動機
11.1 案例背景
11.2 數據理解
11.3 利用因子分析進行信息濃縮
11.4 基於因子分析結果進行市場細分
11.5 項目總結與討論
第12章 1988年漢城奧運會男子十項全能成績分析
12.1 案例背景
12.2 數據理解
12.3 利用因子分析進行信息濃縮
12.4 主成分迴歸
12.5 將主成分迴歸方程還原迴原始變量的形式
12.6 項目總結與討論
第13章 打敗sars
13.1 案例背景
13.2 數據理解與數據準備
13.3 “非典”信息關注傾嚮的多維偏好分析
13.4 突發事件險種購買傾嚮的多重對應分析
13.5 “非典”對未來生活方式的影響
13.6 項目總結與討論
第14章 住院費用影響因素挖掘
14.1 案例背景
14.2 數據理解與數據準備
14.3 采用聚類分析尋找費用類型
14.4 住院費用影響因素的神經網絡分析
14.5 不同療法療效與費用比較的神經網絡分析
14.6 項目總結與討論
第四部分 數據挖掘案例精選
第15章 淘寶大賣傢之營銷數據分析
15.1 案例背景
15.2 利用rfm模型定位促銷名單
15.3 尋找有重購行為買傢的特徵
15.4 總結與討論
第16章 超市商品購買關聯分析
16.1 案例背景
16.2 數據準備
16.3 商品購買關聯分析
16.4 結果應用
第17章 電信業客戶流失分析
17.1 案例背景
17.2 商業理解
17.3 數據理解與數據準備
17.4 建立模型與模型評估
17.5 模型的應用及營銷預演
17.6 總結與討論
第18章 信用風險評分方法
18.1 案例背景
18.2 商業理解
18.3 數據理解與數據準備
18.4 建立模型與模型評估
18.5 對若乾問題的說明
第19章 醫療保險業的欺詐發現
19.1 案例背景
19.2 商業理解
19.3 數據理解與數據準備
19.4 建立模型
19.5 結果發布
19.6 進一步閱讀
第20章 電子商務中的數據挖掘應用
20.1 案例背景
20.2 數據理解
20.3 數據準備
20.4 建立模型與模型發布
20.5 進一步閱讀
附錄
附錄a 本書光盤內容介紹
附錄b spss軟件的安裝與激活
附錄c 書中統計方法、模型與知識點
索引
附錄d ibm spss statiscs函數一覽錶
附錄e ibm spss modeler節點功能簡介
參考文獻
後記
6.5分析結論與討論
6.5.1分析結論
綜上分析,本研究的基本結論如下:
在10種樣品中,大緻可分為兩個評價層次,口味評分較高的是香*、海*、子*和兩種試製品,它們之間無差異。兩種試製品的人群測試效果應當是令人滿意的,可以考慮投入生産,推嚮市場。
在研究涉及的4個城市中,受訪者對相同樣品的評分有所差異,廣州的平均評分低於北京、上海和成都。
本次研究中未發現品牌和城市間存在交互作用,即品牌口味評分間的差異在不同城市間是相同的,尚未發現特殊的地域偏好。
6.5.2Bonehmark:用還是不用
在新品上市研究或者滿意度研究中,方差分析是常用的統計模型。一般而言,當新産品研製齣來後,客戶總是希望它能夠超越目前市場上的大部分同類産品(無論這種同類産品是本公司還是競爭對手的産品)。因此,為瞭保證分析結果能夠貼近實際銷售市場,在研究設計中會考慮將市場上現有的主流産品加入,將其作為比較基準(Benchmark),這個被加入的産品可以是希望替換的本公司産品,也可以是希望打敗的主要競爭對手的産品。這樣新品效果測試中常見的研究組閤可能有如下類型:
所有待研究的新品+希望替換的現有産品。
所有待研究的新品+競爭對手的主打産品。
所有待研究的新品+希望替換的現有産品+競爭對手的主打産品。
根據統計學理論,配對或配伍研究設計的效率遠遠高於普通的成組設計,因此最佳的設計方案是讓每一位受訪者對所有的樣品均給齣評價。但是,在測試樣品較多時,這實際上是不現實的,因為過於冗長的反復測試隻能得到高度失真的劣質數據。此時可能需要采用更精巧的不完全設計,比如每位受訪者隻試用其中的兩種或者三種樣品,在研究設計正確時,使用方差分析模型仍然可以將全部數據連接起來,最終給齣正確的檢驗結論。
在經費充足的情況下,為瞭保證和Benchmarlk樣品比較結果的精確性,還可以對以上設計方法作進一步的優化,例如要求每位受訪者都評價Benchmark和一種新樣品,這樣所有新樣品和Benchmark都有直接比較的結果,因而更為精確。雖然從統計效能的角度講,這樣做並不閤算,但是由於客戶較易接受這種簡單明瞭的設計,且確實能達到提高和Benchmark比較精度的目的,因此當經費充足時,也可以考慮此種方式。
再來看本案例的設計。首先,由於本研究中所涉及的一些其他研究目的的限製,在研究中無法采用每位受訪者品嘗多種樣品的配對或配伍設計方式,隻能采用每位受訪者隻品嘗一種樣品進行評分的方式。其次,實際上在本研究設計中並未明確加入基準樣品,也就是該企業希望用新品替換的老産品並未在設計中齣現,這樣做的原因在於該企業認為目前正在研製的新産品其各項指標都有改進,研究者有充分的信心認為任何一種新配方的效果至少不會低於現有産品,因此不需要進行這種比較。雖然不使用Benchmark是不太常見的做法,但在本研究中應當是可行的。也就是說,真正在統計分析和統計設計中,對相應的統計原則要加以靈活使用,切不可照本宣科,脫離實際。
……
所謂藝術,就是指如果隻靠係統地學習既有知識體係,但自身不具備相當的天賦,或者沒有經過長期實踐以積纍經驗和激發靈感,始終難以登堂入室成為大師的那些學科;音樂、舞蹈、繪畫等就是如此。大英百科全書就把統計學定義為:一門收集數據、分析數據,並根據數據進行推斷的藝術和科學。顯然,作為一門應用學科,統計學非常強調實戰能力。一名齣色的統計師需要通過經曆各種各樣的實戰分析項目來吸取經驗、教訓以便持續成長。光靠操作教科書上那些標準案例,他隻能成為工匠,而不能成為大師。
近年來,隨著計算機技術的飛速發展,統計工具齣現瞭日新月異的變化,大大提高瞭其可用性。統計學和數據庫技術、人工智能技術的融閤,更是進一步催生瞭數據挖掘這個目前炙手可熱,也更強調實戰能力的領域。具體到SPSS係列産品,隨著IBM的並購,原先的SPSS軟件已經成為IBM SPSS Statstics,它定位於標準的統計分析需求,而更貼近企業用戶的數據分析與挖掘的需求則由IBMSPSSModelel‘來滿足。分析工具的高度易用性和實戰需求的同步發展,使得各行各業對統計分析和數據挖掘人員的需求呈現爆炸性增長,遠遠超過瞭正常培養周期能夠提供的數量,而廣大統計分析人員也迫切希望能夠得到的是一本講解提高實戰操作技能的書,而不是單純以介紹某一種統計軟件為目的的參考書,以便幫助自己迅速提升實戰能力。因此,筆者便有瞭編寫這樣一本書的打算。
筆者先後於2000年、2002年和2004年編寫過三輪SPSS教程/參考書,均獲得瞭讀者的好評。作為在數據分析領域從業十餘年的統計專業人員,本書的作者深知在漫長的經驗積纍階段所需要付齣的努力和汗水,更能體會到編寫一本實戰案例書的市場價值。雖然作者從業以來經手的分析案例有上韆個,但很多優秀案例都因涉及相應公司的業務機密而無法和讀者分享。而且案例的復雜程度和代錶性也頗費思量,過於復雜會牽扯太多的具體業務細節,影響案例的可讀性,而案例過於簡單,則無法展示實戰分析中可能遇到的各種情況,參考價值不大。在反復討論之後,筆者最終決定編寫此書,因為這件事情有利於推動數據分析行業的發展,非常值得去做。
IBM SPSS數據分析與挖掘實戰案例精粹(附光盤) 下載 mobi pdf epub txt 電子書 格式 2024
IBM SPSS數據分析與挖掘實戰案例精粹(附光盤) 下載 mobi epub pdf 電子書學習數據分析,提升能力
評分質量不錯,購物方便,就是價格浮動太大
評分不錯,有實戰分享的模型,這樣更便於操作的有用性
評分京東的圖書還是挺好的,內容挺好很實用
評分完全看不懂,天啊,太難瞭。但書皮書頁的質量確實不錯。
評分這一係列的圖書不錯,有參考價值,相信齣版社。
評分假貨,盜版,那個紙他媽薄的能看見背麵的字,再也不在京東買東西瞭。之前買的洗麵奶也是假貨,根本不起沫
評分一般
評分不錯,挺好,是正版。
IBM SPSS數據分析與挖掘實戰案例精粹(附光盤) mobi epub pdf txt 電子書 格式下載 2024