【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效

【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁



點擊這裡下載
    

想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-11-18

類似圖書 點擊查看全場最低價


圖書介紹

店鋪: 鑫舟啓航圖書專營店
ISBN:9787111463115
商品編碼:26899205907
叢書名: Spark快速數據處理
齣版時間:2014-04-01


相關圖書





圖書描述

機工 spark快數數據處理
            定價 29.00
齣版社 機械工業齣版社
版次 1版1次印刷
齣版時間 2014年05月
開本 大32開
作者 (美)凱洛 著,餘璜 張磊 譯
裝幀 平裝
頁數 114
字數 ---
ISBN編碼 9787111463115

Spark是個開源的通用並行分布式計算框架,由加州大學伯剋利分校的AMP實驗室開發,支持內存計算、多迭代批量處理、即席查詢、流處理和圖計算等多種範式。Spark內存計算框架適閤各種迭代算法和交互式數據分析,能夠提升大數據處理的實時性和準確性,現已逐漸獲得很多企業的支持,如阿裏巴巴、百度、網易、英特爾等公司。

本書係統講解Spark的使用方法,包括如何在多種機器上安裝Spark,如何配置個Spark集群,如何在交互模式下運行個Spark作業,如何在Spark集群上構建個生産級的脫機/獨立作業,如何與Spark集群建立連接和使用SparkContext,如何創建和保存RDD(彈性分布式數據集),如何用Spark分布式處理數據,如何設置Shark,將Hive查詢集成到你的Spark作業中來,如何測試Spark作業,以及如何提升Spark任務的性能。

譯者序
作者簡介
前言
1章 安裝Spark以及構建Spark集群
1.1 單機運行Spark
1.2 在EC2上運行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通過SSH部署集群
1.8 鏈接和參考
1.9 小結
2章 Sparkshell的使用
2.1 加載個簡單的text文件
2.2 用Sparkshell運行邏輯迴歸
2.3 交互式地從S3加載數據
2.4 小結
3章 構建並運行Spark應用
3.1 用sbt構建Spark作業
3.2 用Maven構建Spark作業
3.3 用其他工具構建Spark作業
3.4 小結
4章 創建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 鏈接和參考
4.6 小結
5章 加載與保存數據
5.1 RDD
5.2 加載數據到RDD中
5.3 保存數據
5.4 連接和參考
5.5 小結
6章 操作RDD
6.1 用Scala和Java操作RDD
【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 下載 mobi epub pdf txt 電子書 格式


【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 下載 mobi pdf epub txt 電子書 格式 2024

【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

評分

評分

評分

評分

評分

評分

評分

評分

類似圖書 點擊查看全場最低價

【正版】Spark快速數據處理 係統講解Spark的數據處理工具及使用方法 為快速編寫高效 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有