歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
云計(jì)算與大數(shù)據(jù)技術(shù)

云計(jì)算與大數(shù)據(jù)技術(shù)

出版社:清華大學(xué)出版社出版時(shí)間:2018-10-01
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 172
本類(lèi)榜單:教材銷(xiāo)量榜
中 圖 價(jià):¥17.2(4.9折) 定價(jià)  ¥35.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車(chē) 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
溫馨提示:5折以下圖書(shū)主要為出版社尾貨,大部分為全新(有塑封/無(wú)塑封),個(gè)別圖書(shū)品相8-9成新、切口
有劃線標(biāo)記、光盤(pán)等附件不全詳細(xì)品相說(shuō)明>>
本類(lèi)五星書(shū)更多>

云計(jì)算與大數(shù)據(jù)技術(shù) 版權(quán)信息

云計(jì)算與大數(shù)據(jù)技術(shù) 本書(shū)特色

本書(shū)的章節(jié)內(nèi)容如下:第1-4章,講述云計(jì)算的概念和原理,包括云計(jì)算的概論、基礎(chǔ)、虛擬化、應(yīng)用;第5-8章講述大數(shù)據(jù)概述及基礎(chǔ),包括大數(shù)據(jù)概念和發(fā)展背景、大數(shù)據(jù)系統(tǒng)架構(gòu)概述、分布式通信與協(xié)同、大數(shù)據(jù)存儲(chǔ);第9-14章講述大數(shù)據(jù)處理,包括分布式處理、HadoopMapReduce解析、Spark解析、流計(jì)算、集群資源管理與調(diào)度;第14章講述綜合實(shí)踐(在OpenStack平臺(tái)上搭建Hadoop并進(jìn)行數(shù)據(jù)分析)。 注重云計(jì)算與大數(shù)據(jù)基本概念的講解,以案例的方式梳理知識(shí)脈絡(luò)和要點(diǎn),提供綜合云計(jì)算實(shí)驗(yàn)案例

云計(jì)算與大數(shù)據(jù)技術(shù) 內(nèi)容簡(jiǎn)介

本書(shū)在闡述云計(jì)算和大數(shù)據(jù)關(guān)系的基礎(chǔ)上,介紹了云計(jì)算和大數(shù)據(jù)的基本概念、技術(shù)及應(yīng)用。全書(shū)內(nèi)容如下: 第1~4章講述云計(jì)算的概念和原理,包括云計(jì)算的概論、基礎(chǔ)、虛擬化、應(yīng)用; 第5~8章講述大數(shù)據(jù)概述及基礎(chǔ),包括大數(shù)據(jù)概念和發(fā)展背景、大數(shù)據(jù)系統(tǒng)架構(gòu)概述、分布式通信與協(xié)同、大數(shù)據(jù)存儲(chǔ); 第9~13章講述大數(shù)據(jù)處理,包括分布式處理、Hadoop MapReduce解析、Spark解析、流計(jì)算、集群資源管理與調(diào)度; 第14章講述綜合實(shí)踐(在OpenStack平臺(tái)上搭建Hadoop并進(jìn)行數(shù)據(jù)分析)。 本書(shū)結(jié)合實(shí)際應(yīng)用及實(shí)踐過(guò)程來(lái)講解相關(guān)概念、原理和技術(shù),實(shí)用性較強(qiáng)。適合作為本科院校計(jì)算機(jī)、云計(jì)算、大數(shù)據(jù)及信息管理等相關(guān)專(zhuān)業(yè)的教材,也適合計(jì)算機(jī)愛(ài)好者閱讀和參考。

云計(jì)算與大數(shù)據(jù)技術(shù) 目錄


目錄

第1章云計(jì)算概論


1.1什么是云計(jì)算


1.2云計(jì)算的產(chǎn)生背景


1.3云計(jì)算的發(fā)展歷史


1.4如何學(xué)好云計(jì)算


習(xí)題


第2章云計(jì)算基礎(chǔ)


2.1分布式計(jì)算


2.2云計(jì)算的基本概念


2.3云計(jì)算的關(guān)鍵技術(shù)


2.3.1分布式海量數(shù)據(jù)存儲(chǔ)


2.3.2虛擬化技術(shù)


2.3.3云平臺(tái)技術(shù)


2.3.4并行編程技術(shù)


2.3.5數(shù)據(jù)管理技術(shù)


2.4云交付模型


2.4.1軟件即服務(wù)


2.4.2平臺(tái)即服務(wù)


2.4.3基礎(chǔ)設(shè)施即服務(wù)


2.4.4基本云交付模型的比較


2.4.5容器即服務(wù)


2.5云部署模式


2.5.1公有云


2.5.2私有云


2.5.3混合云


2.6云計(jì)算的優(yōu)勢(shì)與挑戰(zhàn)


2.7典型云應(yīng)用


2.7.1云存儲(chǔ)


2.7.2云服務(wù)


2.7.3云物聯(lián)


2.8云計(jì)算與大數(shù)據(jù)


習(xí)題


第3章虛擬化


3.1虛擬化簡(jiǎn)介


3.1.1什么是虛擬化


3.1.2虛擬化的發(fā)展歷史


3.1.3虛擬化帶來(lái)的好處


3.2虛擬化的分類(lèi)


3.2.1服務(wù)器虛擬化


3.2.2網(wǎng)絡(luò)虛擬化


3.2.3存儲(chǔ)虛擬化


3.2.4應(yīng)用虛擬化


3.2.5技術(shù)比較


3.3系統(tǒng)虛擬化


3.4虛擬化與云計(jì)算


3.5開(kāi)源技術(shù)


3.5.1Xen


3.5.2KVM


3.5.3OpenVZ


3.6虛擬化未來(lái)發(fā)展趨勢(shì)


習(xí)題


第4章云計(jì)算的應(yīng)用


4.1概述


4.2Google公司的云計(jì)算平臺(tái)與應(yīng)用


4.2.1MapReduce分布式編程環(huán)境


4.2.2分布式大規(guī)模數(shù)據(jù)庫(kù)管理系統(tǒng)BigTable


4.2.3Google的云應(yīng)用


4.3亞馬遜的彈性計(jì)算云


4.3.1開(kāi)放的服務(wù)


4.3.2靈活的工作模式


4.3.3總結(jié)


4.4IBM藍(lán)云云計(jì)算平臺(tái)


4.4.1藍(lán)云云計(jì)算平臺(tái)中的虛擬化


4.4.2藍(lán)云云計(jì)算平臺(tái)中的存儲(chǔ)結(jié)構(gòu)


4.5清華大學(xué)透明計(jì)算平臺(tái)


4.6阿里云


4.6.1阿里云簡(jiǎn)介


4.6.2阿里云的發(fā)展過(guò)程


4.6.3阿里云的主要產(chǎn)品


4.7Microsoft Azure


4.7.1Microsoft Azure簡(jiǎn)介


4.7.2Microsoft Azure架構(gòu)


4.7.3Microsoft Azure服務(wù)平臺(tái)


4.7.4開(kāi)發(fā)步驟


習(xí)題


第5章大數(shù)據(jù)概念和發(fā)展背景


5.1什么是大數(shù)據(jù)


5.2大數(shù)據(jù)的特點(diǎn)


5.3大數(shù)據(jù)發(fā)展


5.4大數(shù)據(jù)應(yīng)用


習(xí)題


第6章大數(shù)據(jù)系統(tǒng)架構(gòu)概述


6.1總體架構(gòu)概述


6.1.1總體架構(gòu)設(shè)計(jì)原則


6.1.2總體架構(gòu)參考模型


6.2運(yùn)行架構(gòu)概述


6.2.1物理架構(gòu)


6.2.2集成架構(gòu)


6.2.3安全架構(gòu)


6.3主流大數(shù)據(jù)系統(tǒng)廠商


6.3.1Cloudera


6.3.2Hortonworks


6.3.3Amazon


6.3.4Google


6.3.5微軟


6.3.6阿里云數(shù)加平臺(tái)


習(xí)題


第7章分布式通信與協(xié)同


7.1數(shù)據(jù)編碼傳輸


7.1.1數(shù)據(jù)編碼概述


7.1.2LZSS算法


7.1.3Snappy壓縮庫(kù)


7.2分布式通信系統(tǒng)


7.2.1遠(yuǎn)程過(guò)程調(diào)用


7.2.2消息隊(duì)列


7.2.3應(yīng)用層多播通信


7.2.4Hadoop IPC應(yīng)用


7.3分布式協(xié)同系統(tǒng)


7.3.1Chubby鎖服務(wù)


7.3.2ZooKeeper


7.3.3ZooKeeper在HDFS高可用中使用


習(xí)題


第8章大數(shù)據(jù)存儲(chǔ)


8.1大數(shù)據(jù)存儲(chǔ)技術(shù)發(fā)展


8.2海量數(shù)據(jù)存儲(chǔ)的關(guān)鍵技術(shù)


8.2.1數(shù)據(jù)分片與路由


8.2.2數(shù)據(jù)復(fù)制與一致性


8.3重要數(shù)據(jù)結(jié)構(gòu)和算法


8.3.1Bloom Filter


8.3.2LSM樹(shù)


8.3.3Merkle哈希樹(shù)


8.3.4Cuckoo哈希


8.4分布式文件系統(tǒng)


8.4.1文件存儲(chǔ)格式


8.4.2Google文件系統(tǒng)


8.4.3HDFS


8.5分布式數(shù)據(jù)庫(kù)NoSQL


8.5.1NoSQL數(shù)據(jù)庫(kù)概述


8.5.2KV數(shù)據(jù)庫(kù)


8.5.3列式數(shù)據(jù)庫(kù)


8.5.4圖數(shù)據(jù)庫(kù)


8.5.5文檔數(shù)據(jù)庫(kù)


8.6HBase數(shù)據(jù)庫(kù)搭建與使用


8.6.1HBase偽分布式運(yùn)行


8.6.2HBase分布式運(yùn)行


8.7大數(shù)據(jù)存儲(chǔ)技術(shù)趨勢(shì)


習(xí)題


第9章分布式處理


9.1CPU多核和POSIX Thread


9.2MPI并行計(jì)算框架


9.3Hadoop MapReduce


9.4Spark


9.5數(shù)據(jù)處理技術(shù)發(fā)展


習(xí)題


第10章Hadoop MapReduce解析


10.1Hadoop MapReduce架構(gòu)


10.2Hadoop MapReduce與高性能計(jì)算、網(wǎng)格計(jì)算的區(qū)別


10.3MapReduce工作機(jī)制


10.3.1Map


10.3.2Reduce


10.3.3Combine


10.3.4Shuffle


10.3.5Speculative Task


10.3.6任務(wù)容錯(cuò)


10.4應(yīng)用案例


10.4.1WordCount


10.4.2WordMean


10.4.3Grep


10.5MapReduce的缺陷與不足


習(xí)題


第11章Spark解析


11.1Spark RDD


11.2Spark與MapReduce對(duì)比


11.3Spark工作機(jī)制


11.3.1DAG工作圖


11.3.2Partition


11.3.3Lineage容錯(cuò)方法


11.3.4內(nèi)存管理


11.3.5數(shù)據(jù)持久化


11.4數(shù)據(jù)讀取


11.4.1HDFS


11.4.2Amazon S3


11.4.3HBase


11.5應(yīng)用案例


11.5.1日志挖掘


11.5.2判別西瓜好壞


11.6Spark發(fā)展趨勢(shì)


習(xí)題


第12章流計(jì)算


12.1流計(jì)算概述


12.2流計(jì)算與批處理系統(tǒng)對(duì)比


12.3Storm流計(jì)算系統(tǒng)


12.4Samza流計(jì)算系統(tǒng)


12.5集群日志文件實(shí)時(shí)分析


12.6流計(jì)算發(fā)展趨勢(shì)


習(xí)題


第13章集群資源管理與調(diào)度


13.1集群資源統(tǒng)一管理系統(tǒng)


13.1.1集群資源管理概述


13.1.2Apache YARN


13.1.3Apache Mesos


13.1.4Google Omega


13.2資源管理模型


13.2.1基于slot的資源表示模型


13.2.2基于*大、*小公平原則的資源分配模型


13.3資源調(diào)度策略


13.3.1調(diào)度策略概述


13.3.2Capacity Scheduler調(diào)度


13.3.3Fair Scheduler調(diào)度


13.4YARN上運(yùn)行計(jì)算框架


13.4.1MapReduce on YARN


13.4.2Spark on YARN


13.4.3YARN程序設(shè)計(jì)


習(xí)題


第14章綜合實(shí)踐: 在OpenStack平臺(tái)上搭建Hadoop并進(jìn)行數(shù)據(jù)分析


14.1OpenStack簡(jiǎn)介


14.2OpenStack的安裝及配置


14.2.1OpenStack安裝準(zhǔn)備


14.2.2OpenStack在線安裝


14.2.3搭建OpenStack中的虛擬機(jī)


14.3大數(shù)據(jù)環(huán)境安裝


14.3.1Java安裝


14.3.2Hadoop安裝


14.4大數(shù)據(jù)分析案例


14.4.1日志分析


14.4.2電商購(gòu)買(mǎi)記錄分析


14.4.3交通流量分析


參考文獻(xiàn)


展開(kāi)全部

云計(jì)算與大數(shù)據(jù)技術(shù) 節(jié)選

第3章虛擬化 本章介紹的是虛擬化技術(shù),將對(duì)虛擬化的簡(jiǎn)介、虛擬化技術(shù)的分類(lèi)、系統(tǒng)虛擬化、虛擬化與云計(jì)算、相關(guān)開(kāi)源技術(shù)以及虛擬化未來(lái)的發(fā)展趨勢(shì)進(jìn)行講解,包括虛擬化的發(fā)展歷史以及虛擬化帶來(lái)的好處。通過(guò)對(duì)本章的學(xué)習(xí),讀者應(yīng)該能對(duì)虛擬化技術(shù)有系統(tǒng)的了解以及對(duì)相關(guān)技術(shù)有一定的認(rèn)識(shí)。 3.1虛擬化簡(jiǎn)介 隨著近年多核系統(tǒng)、集群、網(wǎng)格甚至云計(jì)算的廣泛部署,虛擬化技術(shù)在應(yīng)用上的優(yōu)勢(shì)日益體現(xiàn),通過(guò)使用虛擬化,不僅可以降低IT成本,而且可以增強(qiáng)系統(tǒng)的安全性和可靠性,虛擬化的概念逐漸深入到人們?nèi)粘5墓ぷ髋c生活當(dāng)中。 3.1.1什么是虛擬化 虛擬化是指計(jì)算機(jī)軟件在虛擬的基礎(chǔ)上而不是在真實(shí)的、獨(dú)立的物理硬件基礎(chǔ)上運(yùn)行。例如,CPU的虛擬化技術(shù)可以實(shí)現(xiàn)單CPU模擬多CPU并行,允許一個(gè)平臺(tái)同時(shí)運(yùn)行多個(gè)操作系統(tǒng),并且應(yīng)用程序可以在相互獨(dú)立的空間內(nèi)運(yùn)行而互不影響,從而顯著提高計(jì)算機(jī)的工作效率。這種以優(yōu)化資源(把有限的、固定的資源根據(jù)不同的需求進(jìn)行重新規(guī)劃以達(dá)到*大利用率)、簡(jiǎn)化軟件的重新配置過(guò)程為目的的解決方案,就是虛擬化技術(shù)。 圖31展示了虛擬化架構(gòu)與傳統(tǒng)架構(gòu)的對(duì)比。簡(jiǎn)單來(lái)講,虛擬化架構(gòu)就是在一個(gè)物理硬件機(jī)器上同時(shí)運(yùn)行多個(gè)不同應(yīng)用的獨(dú)立的虛擬系統(tǒng)。這些同時(shí)運(yùn)行的虛擬系統(tǒng)由Hyperviser來(lái)控制,虛擬機(jī)被稱為guest。Hypervisor不僅可以提供虛擬系統(tǒng)資源,進(jìn)行主機(jī)/虛擬機(jī)之間的調(diào)度,而且可以提供虛擬機(jī)間的通信。虛擬化服務(wù)器的應(yīng)用如下。 圖31虛擬化架構(gòu)與傳統(tǒng)架構(gòu)的對(duì)比 1. 研發(fā)與測(cè)試 提到虛擬化服務(wù)器的應(yīng)用,人們首先想到的就是研發(fā)測(cè)試環(huán)境,因?yàn)樵谝话闱闆r下,研發(fā)和測(cè)試人員需要使用不同的操作系統(tǒng)環(huán)境,而如果每一種平臺(tái)都需要使用物理服務(wù)器,這將會(huì)對(duì)準(zhǔn)備測(cè)試環(huán)境的過(guò)程帶來(lái)相當(dāng)大的困難,一個(gè)小小的測(cè)試改變都需要重裝若干這樣的測(cè)試用服務(wù)器。如果一個(gè)測(cè)試過(guò)程需要成百上千臺(tái)服務(wù)器進(jìn)行壓力測(cè)試時(shí),準(zhǔn)備純物理服務(wù)器的測(cè)試環(huán)境幾乎不可能,虛擬化技術(shù)無(wú)疑是*佳的選擇。 通過(guò)在一臺(tái)物理服務(wù)器上實(shí)現(xiàn)多個(gè)操作系統(tǒng),或者實(shí)現(xiàn)成百上千個(gè)虛擬的服務(wù)器,可以極大地降低研發(fā)和測(cè)試成本。 2. 服務(wù)器合并 很多企業(yè)用戶都不得不面對(duì)這樣的尷尬: 每實(shí)施一項(xiàng)應(yīng)用就要買(mǎi)一臺(tái)服務(wù)器,隨著應(yīng)用的增加,一般要購(gòu)買(mǎi)很多不易變更的資源,在這個(gè)過(guò)程中,完成不同任務(wù)的服務(wù)器越來(lái)越多,管理變得越來(lái)越復(fù)雜,同時(shí)服務(wù)器利用率卻很低,僅為15%~20%,將會(huì)造成資源的極大浪費(fèi)。 因此,將各種不同的服務(wù)器整合在一起的方案受到了用戶的歡迎。但是整合在一起的服務(wù)器如何分配資源,并保證每一個(gè)應(yīng)用的正常運(yùn)行呢?服務(wù)器從小變大是一個(gè)問(wèn)題,而將大塊計(jì)算資源分成小塊也是一個(gè)問(wèn)題。虛擬服務(wù)器技術(shù)的出現(xiàn)輕松地解決了服務(wù)器合并的問(wèn)題,從而受到更多企業(yè)用戶的青睞。 3. 高級(jí)虛擬主機(jī) 虛擬主機(jī)技術(shù)的出現(xiàn),大大降低了在互聯(lián)網(wǎng)上建立站點(diǎn)的資金門(mén)檻。可以說(shuō),正是這樣的虛擬技術(shù)構(gòu)筑起了互聯(lián)網(wǎng)的大廈。但隨著互聯(lián)網(wǎng)的普及,客戶常常抱怨虛擬主機(jī)做了過(guò)多的限制,而且穩(wěn)定性不好,資源很難保證。現(xiàn)在的虛擬主機(jī)用戶對(duì)虛擬主機(jī)服務(wù)提出了更高的要求,用戶需要更安全、穩(wěn)定的環(huán)境,甚至是對(duì)部分資源的控制權(quán)。

暫無(wú)評(píng)論……
書(shū)友推薦
本類(lèi)暢銷(xiāo)
編輯推薦
返回頂部
中圖網(wǎng)
在線客服