內容簡介
本書關注軟件工程中的數據科學主題,包括數據收集、數據分析、數據挖掘等,重點講解如何將這些技術成功應用於軟件工程項目。通過閱讀本書,新手將學到有益的提示和技巧,而有經驗的數據科學傢則可以從實戰專傢的經驗中瞭解如何避開陷阱。
目錄
譯者序
本書作者
第1章 簡介 1
1.1 軟件工程的數據科學視角 1
1.2 軟件分析與實際應用 4
1.3 歸納式軟件工程的七個原則:我們做的是不同的 7
1.4 軟件工程中對數據分析模式的需求 11
1.5 從軟件數據到軟件理論:到達的捷徑 14
1.6 為何理論是重要的 17
第2章 成功案例與應用 21
2.1 挖掘應用中的異常 21
2.2 擁抱動態工件 25
2.3 移動應用商店分析 28
2.4 軟件的自然性 30
2.5 版本發布就緒的研究進展 34
2.6 如何徵服你的在綫服務 37
2.7 評價個人生産率 40
2.8 基於堆棧跟蹤的攻擊麵檢測 43
2.9 軟件工程數據的視覺分析 46
2.10 遊戲數據分組後效果更佳 49
2.11 實踐中應用數據科學的成功故事 52
2.12 從來沒有足夠的時間做所有需要的測試 56
2.13 能源開采的危險:多次衡量,一次比較 59
2.14 大規模商業軟件中的錯誤文件定位 63
2.15 定製組件:個性化問題跟蹤的機遇 66
2.16 至關重要的是決策而非數字:分析設計錶 68
2.17 編程語言對代碼質量影響的係統研究 72
2.18 代碼審查不是為瞭尋找缺陷:即使已建立的工具也需要偶爾進行評估 74
第3章 技術 78
3.1 會談 78
3.2 查找暫存數據中的狀態轉換 83
3.3 卡片分類:從文本到主題 85
3.4 工具!工具!我們需要工具 88
3.5 基於證據的軟件工程 93
3.6 你需要哪種機器學習方法 96
3.7 首先結構化你的非結構化數據!用標簽雲概括非結構化數據的案例 99
3.8 解析數據!準備原始數據的實用技巧 105
3.9 自然語言處理不是免費的午餐 109
3.10 聚集經驗證據進行更可信的決策 112
3.11 如果是軟件工程,它可能是一個貝葉斯因子 117
3.12 隱私和數據共享都要有恰如其分的條件 120
3.13 軟件工程可預測模型中的群體智慧 124
3.14 挖掘軟件數據時兼顧定量方法和定性方法 128
3.15 為存活而調查設計的過程和為遠航而調查部署的過程 132
第4章 智慧與技巧 138
4.1 記錄一切? 138
4.2 起源的重要性 140
4.3 從一開始就保持開放 144
4.4 減少洞察時間 147
4.5 獲取成功的五步:如何在組織中部署數據科學 150
4.6 發布過程如何影響軟件分析 153
4.7 安全無價 156
4.8 挖掘錯誤報告中的陷阱 159
4.9 使可視化成為分析過程的一部分 163
4.10 不要忘記開發者(小心你的假設) 165
4.11 研究的局限性和語境 168
4.12 可執行的指標纔是更好的指標 171
4.13 可復製的結果更可靠 175
4.14 軟件工程研究的多樣性 178
4.15 一次還不夠:為什麼需要重復 181
4.16 不僅僅是數字:可視化的需求 184
4.17 不要使自己尷尬:小心數據中的偏差 187
4.18 操作數據丟失、錯誤和脫離語境 193
4.19 數據科學在改進和評估過程中演化? 197
4.20 相關性不是因果關係(不要大叫“找到瞭!”) 199
4.21 小軟件公司的軟件分析:問題比答案更多 202
4.22 路燈下的軟件分析(《星際迷航》教會我們提齣正確問題的重要性) 205
4.23 軟件工程實驗中會齣現哪些錯誤 208
4.24 同樣的大小並不適閤所有情況 211
4.25 對於好的模型,簡單的解釋更好 212
4.26 白襯衫效應:從失敗的期望中學習 215
4.27 簡單的問題能導緻更好的見解 218
4.28 連續實驗以盡早評估價值 222
4.29 謊言、可惡的謊言和分析:為什麼大數據需要厚數據 225
4.30 整個世界都是你的測試套件 229
大數據時代的軟件工程:軟件科學傢與數據科學傢的思維碰撞 下載 mobi epub pdf txt 電子書 格式