Hadoop大數據開發基礎

Hadoop大數據開發基礎 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
餘明輝,張良均 著



點擊這裡下載
    

想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-23

類似圖書 點擊查看全場最低價


圖書介紹

齣版社: 人民郵電齣版社
ISBN:9787115370662
版次:1
商品編碼:12308506
包裝:平裝
叢書名: 大數據人纔培養規劃教材
開本:16開
齣版時間:2018-02-01
用紙:膠版紙
頁數:188
正文語種:中文


相關圖書





圖書描述

産品特色


編輯推薦

大數據專傢張良均領銜暢銷書作者團隊,教育部長江學者特聘教授、國傢傑齣青年基金獲得者、IEEE Fellow、華南理工大學計算機與工程學院院長張軍傾力推薦。
本書采用瞭以任務為導嚮的教學模式,按照解決實際任務的工作流程路綫,逐步展開介紹相關的理論知識點,推導生成可行的解決方案,落實在任務實現環節。
全書大部分章節緊扣任務需求展開,不堆積知識點,著重於解決問題時思路的啓發與方案的實施。通過從任務需求到實現這一完整工作流程的體驗,幫助讀者真正理解與消化Hadoop大數據技術。
書中案例全部源於企業真實項目,可操作性強,引導讀者融會貫通,並提供源代碼等相關學習資源,幫助讀者快速掌握大數據相關技能。

內容簡介

本書以任務為導嚮,較為全麵地介紹瞭Hadoop大數據技術的相關知識。全書共6章,具體內容包括Hadoop介紹、Hadoop集群的搭建及配置、Hadoop基礎操作、MapReduce編程入門、MapReduce進階編程、項目案例:電影網站用戶性彆預測。本書的2~5章包含瞭實訓與課後練習,通過練習和操作實踐,幫助讀者鞏固所學的內容。
本書可以作為高校大數據技術類專業的教材,也可作為大數據技術愛好者的自學用書。

作者簡介

張良均,高 級信息係統項目管理師,泰迪杯全國大學生數據挖掘競賽(www.tipdm.org)發起人。華南師範大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經曆,主要從事大數據挖掘及其應用的策劃、研發及谘詢培訓。全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。發錶數據挖掘相關論文數二十餘篇,已取得國傢發明專利12項,主編《Hadoop大數據分析與挖掘實戰》《Python數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等多本暢銷圖書,主持並完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。


目錄

一章 Hadoop介紹 1
1.1 Hadoop概述 1
1.1.1 Hadoop簡介 1
1.1.2 Hadoop的發展曆史 2
1.1.3 Hadoop的特點 3
1.2 Hadoop核心 4
1.2.1 分布式文件係統——HDFS 4
1.2.2 分布式計算框架——MapReduce 7
1.2.3 集群資源管理器——YARN 9
1.3 Hadoop生態係統 12
1.4 Hadoop應用場景 14
小結 15
二章 Hadoop集群的搭建及配置 16
任務2.1 安裝及配置虛擬機 17
2.1.1 創建Linux虛擬機 17
2.1.2 設置固定IP 25
2.1.3 遠程連接虛擬機 27
2.1.4 虛擬機在綫安裝軟件 29
2.1.5 任務實現 32
任務2.2 安裝Java 32
2.2.1 在Windows下安裝Java 33
2.2.2 在Linux下安裝Java 35
2.2.3 任務實現 36
任務2.3 搭建Hadoop完全分布式集群 36
2.3.1 修改配置文件 36
2.3.2 剋隆虛擬機 41
2.3.3 配置SSH免密碼登錄 43
2.3.4 配置時間同步服務 44
2.3.5 啓動關閉集群 46
2.3.6 監控集群 47
小結 50
實訓 50
實訓1 為Hadoop集群增加一個節點 50
實訓2 編寫Shell腳本同步集群時間 51
課後練習 51
第3章 Hadoop基礎操作 53
任務3.1 查看Hadoop集群的基本信息 54
3.1.1 查詢集群的存儲係統信息 55
3.1.2 查詢集群的計算資源信息 58
任務3.2 上傳文件到HDFS目錄 59
3.2.1 瞭解HDFS文件係統 59
3.2.2 掌握HDFS的基本操作 62
3.2.3 任務實現 65
任務3.3 運行MapReduce任務 67
3.3.1 瞭解Hadoop官方的示例程序包 67
3.3.2 提交MapReduce任務給集群運行 68
任務3.4 管理多個MapReduce任務 71
3.4.1 查詢MapReduce任務 72
3.4.2 中斷MapReduce任務 74
小結 76
實訓 77
實訓1 統計文件中所有單詞的平均長度 77
實訓2 查詢與中斷MapReduce任務 77
課後練習 78
第4章 MapReduce編程入門 80
任務4.1 使用Eclipse創建MapReduce工程 81
4.1.1 下載與安裝Eclipse 81
4.1.2 配置MapReduce環境 82
4.1.3 新建MapReduce工程 84
任務4.2 通過源碼初識MapReduce編程 86
4.2.1 通俗理解MapReduce原理 86
4.2.2 瞭解MR實現詞頻統計的執行流程 88
4.2.3 讀懂官方提供的WordCount源碼 89
任務4.3 編程實現按日期統計訪問次數 94
4.3.1 分析思路與處理邏輯 94
4.3.2 編寫核心模塊代碼 95
4.3.3 任務實現 97
任務4.4 編程實現按訪問次數排序 99
4.4.1 分析思路與處理邏輯 99
4.4.2 編寫核心模塊代碼 100
4.4.3 任務實現 102
小結 104
實訓 104
實訓1 獲取成績錶的高分記錄 104
實訓2 對兩個文件中的數據進行閤並與去重 105
課後練習 107
第5章 MapReduce進階編程 110
任務5.1 篩選日誌文件並生成序列化文件 111
5.1.1 MapReduce輸入格式 111
5.1.2 MapReduce輸齣格式 113
5.1.3 任務實現 113
任務5.2 Hadoop Java API讀取序列化日誌文件 115
5.2.1 FileSystem API管理文件夾 115
5.2.2 FileSystem API操作文件 119
5.2.3 FileSystem API讀寫數據 121
5.2.4 任務實現 123
任務5.3 優化日誌文件統計程序 124
5.3.1 自定義鍵值類型 124
5.3.2 初步探索Combiner 128
5.3.3 淺析Partitioner 130
5.3.4 自定義計數器 132
5.3.5 任務實現 134
任務5.4 Eclipse提交日誌文件統計程序 137
5.4.1 傳遞參數 137
5.4.2 Hadoop輔助類ToolRunner 139
5.4.3 Eclipse自動打包並提交任務 140
小結 144
實訓 144
實訓1 統計全球每年的高氣溫和低氣溫 144
實訓2 篩選氣溫在15~25℃之間的數據 145
課後練習 146
第6章 項目案例:電影網站用戶性彆預測 151
任務6.1 認識KNN算法 152
6.1.1 KNN算法簡介 152
6.1.2 KNN算法原理及流程 152
任務6.2 數據預處理 154
6.2.1 獲取數據 154
6.2.2 數據變換 155
6.2.3 數據清洗 160
6.2.4 劃分數據集 163
任務6.3 實現用戶性彆分類 167
6.3.1 實現思路 167
6.3.2 代碼實現 169
任務6.4 評價分類結果的準確性 179
6.4.1 評價思路 179
6.4.2 實現分類評價 180
6.4.3 尋找優K值 184
小結 188
參考文獻 189
Hadoop大數據開發基礎 下載 mobi epub pdf txt 電子書 格式

Hadoop大數據開發基礎 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

Hadoop大數據開發基礎 下載 mobi pdf epub txt 電子書 格式 2024

Hadoop大數據開發基礎 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

書本很難,慢慢看吧!好厚一本。

評分

書是正版本的,需要這本書,網購省去瞭去書店找書的麻煩。

評分

此用戶未填寫評價內容

評分

可以,很快

評分

書是正版本的,需要這本書,網購省去瞭去書店找書的麻煩。

評分

可以,很快

評分

書寫的比較粗糙,水平一般

評分

書是正版本的,需要這本書,網購省去瞭去書店找書的麻煩。

評分

學校老師搞事情 買瞭書又讓我們重新買

類似圖書 點擊查看全場最低價

Hadoop大數據開發基礎 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有