編輯推薦
如何恢復銷售額?
哪種廣告的效果會更好?
遊戲用戶為何會流失?
如何讓組隊遊戲充滿樂趣?
……
一綫數據分析師教你用數據搞定!
1.通過8個真實的商業案例,學會用數據分析解決商業難題。
2.使用未經清洗的原始數據,體驗真實的數據分析流程。
(在其他同類書中,經常故意使用和書中內容高度相符的數據來分析,但是讀者會發現在實際的業務中使用書中的方法卻很睏難,數據分析實戰 的各個案例中提供的都是zui原始的數據,需要在使用前進行加工。針對這些數據,如何靈活使用統計解析工具來處理,作者也給齣瞭詳細的介紹。)
3.網羅柱狀圖、交叉列錶統計、A/B測試、多元迴歸分析、邏輯迴歸分析、主成分分析、聚類、決策樹分析、機器學習等數據分析方法。
4.數據分析實戰 使用的數據和R腳本代碼可下載。
內容簡介
數據分析實戰 由實戰經驗豐富的兩位數據分析師執筆,數據分析實戰 首先介紹瞭商業領域裏通用的數據分析框架,然後根據該框架,結閤8個真實的案例,詳細解說瞭通過數據分析解決各種商業問題的流程,讓讀者在解決問題的過程中學習各種數據分析方法,包括柱狀圖、交叉列錶統計、A/B測試、多元迴歸分析、邏輯迴歸分析、聚類、主成分分析、決策樹分析、機器學習等。特彆是書中使用的數據都是未經清洗的原始數據,對如何加工數據以用於數據分析也進行瞭詳細的介紹。讀者可以使用R語言實際操作數據,體驗真實的數據分析流程,避免紙上談兵。
作者簡介
酒捲隆治(作者)
浦和齣身。環境學博士畢業。就職於株式會社DRECOM數據分析部門。擅長人類行動日誌的分析。現主要從事社交遊戲和在綫服務的日誌分析工作。
裏洋平(作者)
種子島齣身。就職於株式會社DRECOM數據分析部門。擅長使用R語言進行數據分析,現主要從事數據分析環境的搭建和數據分析工作。閤著有《數據科學養成讀本》(技術評論社)、《R包使用手冊》(東京圖書)。
肖峰(譯者)
日本東京工業大學計算機工學博士。曾在日本樂天株式會社樂天技術研究所從事研究工作。2013年迴國後加入新浪,現任新浪個性化推薦團隊算法負責人。擁有豐富的數據分析與建模能力。
目錄
第1章 數據科學傢的工作 1
1.1 什麼是數據科學傢 2
1.2 3種類型的數據科學傢 5
1.3 數據科學傢的現狀 8
第2章 商業數據分析流程 9
2.1 數據分析的5個流程 10
2.2 現狀和預期 12
2.3 發現問題 13
2.4 數據的收集和加工 19
2.5 數據分析 24
2.6 解決對策 27
2.7 小結 29
[分析基礎]篇
第3章 案例1—柱狀圖
為什麼銷售額會減少 35
3.1 現狀和預期 36
3.2 發現問題 38
3.3 數據的收集和加工 39
3.4 數據分析 46
3.5 解決對策 49
3.6 小結 50
3.7 詳細的R代碼 51
第4章 案例2—交叉列錶統計
什麼樣的顧客會選擇離開 61
4.1 現狀和預期 62
4.2 發現問題 64
4.3 數據的收集和加工 65
4.4 數據分析 69
4.5 解決對策 73
4.6 小結 75
4.7 詳細的R代碼 76
第5章 案例3—A/B測試
哪種廣告的效果更好 83
5.1 現狀和預期 84
5.2 發現問題 86
5.3 數據的收集和加工 88
5.4 數據分析 96
5.5 解決對策 98
5.6 小結 99
5.7 詳細的R代碼 100
第6章 案例4—多元迴歸分析 105
如何通過各種廣告的組閤獲得更多的用戶 105
6.1 現狀和預期 106
6.2 發現問題 108
6.3 數據的收集 112
6.4 數據分析 114
6.5 解決對策 117
6.6 小結 119
6.7 詳細的R代碼 120
[分析應用]篇
第7章 案例5—邏輯迴歸分析
根據過去的行為能否預測當下 125
7.1 期望增加遊戲的智能手機用戶量 126
7.2 是用戶賬號遷轉設定失敗導緻的問題嗎 128
7.3 在數據不包含正解的情況下收集數據 131
7.4 驗證是否能夠建立模型 144
7.5 解決對策 148
7.6 小結 149
7.7 詳細的R代碼 150
第8章 案例6—聚類
應該選擇什麼樣的目標用戶群 163
8.1 希望瞭解用戶的特點 164
8.2 基於行為模式的用戶分類 165
8.3 把主成分作為自變量來使用 168
8.4 進行聚類 176
8.5 解決對策 180
8.6 小結 181
8.7 詳細的R代碼 182
第9章 案例7—決策樹分析
具有哪些行為的用戶會是長期用戶 193
9.1 希望減少用戶開始遊戲後不久就離開的情況 194
9.2 瞭解“樂趣”的結構 195
9.3 把類作為自變量 198
9.4 進行決策樹分析 210
9.5 解決對策 213
9.6 小結 215
9.7 詳細的R代碼 216
第10章 案例8—機器學習
如何讓組隊遊戲充滿樂趣 233
10.1 使組隊作戰的樂趣最大化 234
10.2 利用數據分析為服務增加附加價值 236
10.3 在數據中排除星期的影響 238
10.4 構建預測模型 241
10.5 解決對策 248
10.6 小結 249
10.7 詳細的R代碼 250
數據分析實戰 下載 mobi epub pdf txt 電子書 格式