大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說(shuō)明>>
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
深度學(xué)習(xí)
-
>
Unreal Engine 4藍(lán)圖完全學(xué)習(xí)教程
-
>
深入理解計(jì)算機(jī)系統(tǒng)-原書(shū)第3版
-
>
Word/Excel PPT 2013辦公應(yīng)用從入門到精通-(附贈(zèng)1DVD.含語(yǔ)音視頻教學(xué)+辦公模板+PDF電子書(shū))
大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 版權(quán)信息
- ISBN:9787111686187
- 條形碼:9787111686187 ; 978-7-111-68618-7
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 本書(shū)特色
以精煉的語(yǔ)言和經(jīng)典實(shí)例,用圖文并茂的形式,向讀者生動(dòng)展示大數(shù)據(jù)技術(shù)商業(yè)實(shí)戰(zhàn)開(kāi)發(fā)
大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 內(nèi)容簡(jiǎn)介
本書(shū)全面詳細(xì)地介紹了大數(shù)據(jù)生態(tài)系統(tǒng)中的主流技術(shù)。全書(shū)共10章,主要包括大數(shù)據(jù)生態(tài)系統(tǒng)概述、大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)存儲(chǔ)技術(shù)、大數(shù)據(jù)分析處理技術(shù)等內(nèi)容,書(shū)中涵蓋了Hadoop、Hive、Hbase、Kafka、Spark、Flink等技術(shù)的原理和實(shí)踐,其中重點(diǎn)介紹了Hadoop技術(shù)、Spark技術(shù)及Flink技術(shù)。本書(shū)詳細(xì)介紹了主流大數(shù)據(jù)技術(shù)框架的基本原理、環(huán)境搭建、操作使用和在典型行業(yè)中的具體應(yīng)用,使讀者不僅能夠在宏觀上全面認(rèn)知大數(shù)據(jù)生態(tài)系統(tǒng),而且還能在微觀上深入理解大數(shù)據(jù)技術(shù)細(xì)節(jié)。本書(shū)不僅適合大數(shù)據(jù)技術(shù)初學(xué)者閱讀,還可以幫助金融、電信、電商、能源、政府部門的大數(shù)據(jù)應(yīng)用決策和技術(shù)人員,以及IT經(jīng)理、CTO、CIO等快速學(xué)習(xí)大數(shù)據(jù)技術(shù),并能作為大數(shù)據(jù)相關(guān)崗位培訓(xùn)的教程。
大數(shù)據(jù)技術(shù)入門到商業(yè)實(shí)戰(zhàn) Hadoop+Spark+Flink全解析 目錄
第1章 初識(shí)大數(shù)據(jù)
1.1 什么是大數(shù)據(jù)
1.2 大數(shù)據(jù)行業(yè)應(yīng)用
1.3 什么是Hadoop
1.4 Hadoop產(chǎn)生背景
1.5 Hadoop的架構(gòu)模塊介紹
1.6 Hadoop在大數(shù)據(jù)、云計(jì)算中的位置和關(guān)系
1.7 國(guó)內(nèi)外Hadoop應(yīng)用案例介紹
1.8 Hadoop生態(tài)圈以及各組成部分簡(jiǎn)介
1.9 本章小結(jié)
第2章 Hadoop之分布式文件系統(tǒng)HDFS
2.1 構(gòu)建Hadoop集群
2.1.1 集群簡(jiǎn)介
2.1.2 Hadoop集群部署
2.2 Hadoop集群?jiǎn)?dòng)和停止
2.2.1 Hadoop集群?jiǎn)?dòng)
2.2.2 Hadoop集群停止
2.3 HDFS的Shell命令行客戶端操作
2.4 HDFS的工作機(jī)制
2.4.1 HDFS概述
2.4.2 HDFS的重要特性
2.4.3 HDFS寫(xiě)數(shù)據(jù)流程
2.4.4 HDFS讀數(shù)據(jù)流程
2.5 NameNode和SecondaryNameNode功能剖析
2.5.1 NameNode與SecondaryNameNode解析
2.5.2 元數(shù)據(jù)的checkpoint的條件
2.5.3 fsimage與edits詳解
2.5.4 fsimage和edits文件信息查看
2.6 DataNode的工作機(jī)制及存儲(chǔ)
2.6.1 DataNode工作機(jī)制
2.6.2 數(shù)據(jù)完整性保證
2.6.3 DataNode掉線判斷時(shí)限參數(shù)
2.7 HDFS的安全模式
2.8 本章小結(jié)
第3章 Hadoop之分布式計(jì)算MapReduce
3.1 MapReduce概述
3.1.1 MapReduce介紹
3.1.2 為什么要使用MapReduce
3.2 MapReduce框架結(jié)構(gòu)及核心運(yùn)行機(jī)制
3.3 MapReduce編程規(guī)范和示例編寫(xiě)
3.3.1 編程規(guī)范
3.3.2 MapReduce編程入門之單詞計(jì)數(shù)
3.4 MapTask數(shù)量及切片機(jī)制
3.4.1 MapTask個(gè)數(shù)
3.4.2 如何控制MapTask的個(gè)數(shù)
3.4.3 Map并行度的經(jīng)驗(yàn)之談
3.5 ReduceTask并行度的決定
3.6 MapReduce中的combiner
3.7 MapReduce中的Shuffle
3.7.1 Map端
3.7.2 Reduce端
3.7.3 Shuffle小結(jié)
3.8 MapReduce與Yam
3.8.1 Yarn概述
3.8.2 Yarn的重要概念
3.9 MapReduce在Yarn上運(yùn)行流程
……
第4章 分布式協(xié)調(diào)服務(wù)Zookeeper
第5章 分布式數(shù)據(jù)庫(kù)Hbase
第6章 數(shù)據(jù)倉(cāng)庫(kù)Hive
第7章 日志采集框架Flume
第8章 分布式消息系統(tǒng)Kafka
第9章 Spark內(nèi)存計(jì)算框架
第10章 Flink實(shí)時(shí)流處理
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(shū)(紅燭學(xué)術(shù)叢書(shū))
- >
月亮虎
- >
莉莉和章魚(yú)
- >
【精裝繪本】畫(huà)給孩子的中國(guó)神話
- >
有舍有得是人生
- >
推拿
- >
中國(guó)歷史的瞬間
- >
山海經(jīng)