歡迎光臨中圖網(wǎng) 請 | 注冊
> >
數(shù)據(jù)清洗(第2版)

數(shù)據(jù)清洗(第2版)

出版社:清華大學(xué)出版社出版時間:2024-08-01
開本: 其他 頁數(shù): 320
本類榜單:教材銷量榜
中 圖 價:¥40.6(7.0折) 定價  ¥58.0 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
本類五星書更多>

數(shù)據(jù)清洗(第2版) 版權(quán)信息

數(shù)據(jù)清洗(第2版) 本書特色

本書以Kettle 9.2為基礎(chǔ),全面介紹了使用Kettle實現(xiàn)ETL的相關(guān)操作。全書共8章,分別講解了數(shù)據(jù)清洗的概念、ETL的概念、Kettle的安裝和使用、使用Kettle實現(xiàn)數(shù)據(jù)抽取、使用Kettle實現(xiàn)數(shù)據(jù)清洗、使用Kettle實現(xiàn)數(shù)據(jù)轉(zhuǎn)換和使用Kettle實現(xiàn)數(shù)據(jù)加載,并在 綜合運用前面所學(xué)的知識,構(gòu)建一個電影租賃商店數(shù)據(jù)倉庫,加深對Kettle和ETL的理解和掌握。本書通過詳細(xì)的示例引導(dǎo),使讀者掌握運用Kettle的操作;講解通俗易懂,讓讀者 易理解ETL的本質(zhì);理論結(jié)合實際操作,使讀者全面掌握Kettle相關(guān)知識;一個實際案例貫穿全書,使讀者領(lǐng)略并掌握開發(fā)大數(shù)據(jù)應(yīng)用系統(tǒng)的完整過程。 本書可以作為高等院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)及相關(guān)專業(yè)的教材,并適合大數(shù)據(jù)開發(fā)初學(xué)者、ETL工程師以及數(shù)據(jù)倉庫開發(fā)的從業(yè)者閱讀。

數(shù)據(jù)清洗(第2版) 內(nèi)容簡介

"本書以Kettle 9.2為基礎(chǔ),全面介紹使用Kettle實現(xiàn)ETL的相關(guān)操作。全書共8章,分別講解數(shù)據(jù)清洗和ETL的概念,Kettle的安裝和使用,如何使用Kettle實現(xiàn)數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載,并在*后綜合運用上述知識,構(gòu)建一個電影租賃商店數(shù)據(jù)倉庫,以使讀者加深對Kettle和ETL的理解與掌握。 本書附有配套視頻、教學(xué)PPT、教學(xué)設(shè)計、測試題等資源,同時,為了幫助初學(xué)者更好地學(xué)習(xí)本書中的內(nèi)容,還提供了在線答疑,歡迎讀者關(guān)注。 本書可以作為高等院校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)及相關(guān)專業(yè)的教材,也適合大數(shù)據(jù)開發(fā)初學(xué)者、ETL工程師以及數(shù)倉開發(fā)的從業(yè)者閱讀。 "

數(shù)據(jù)清洗(第2版) 目錄

第1章 數(shù)據(jù)清洗概述 1.1 數(shù)據(jù)清洗的背景 1.1.1 數(shù)據(jù)質(zhì)量概述 1.1.2 數(shù)據(jù)質(zhì)量的評價指標(biāo) 1.1.3 數(shù)據(jù)質(zhì)量問題的分類 1.2 數(shù)據(jù)清洗的定義 1.3 數(shù)據(jù)清洗基本流程 1.4 數(shù)據(jù)清洗策略 1.5 數(shù)據(jù)清洗常用的方法 1.6 數(shù)據(jù)清洗面臨的挑戰(zhàn) 1.7 本章小結(jié) 1.8 課后習(xí)題 第2章 初識ETL 2.1 ETL的定義 2.2 ETL的體系結(jié)構(gòu) 2.3 ETL關(guān)鍵步驟 2.3.1 抽取 2.3.2 轉(zhuǎn)換 2.3.3 加載 2.4 常見的ETL工具 2.5 本章小結(jié) 2.6 課后習(xí)題 第3章 Kettle 3.1 初識Kettle 3.1.1 Kettle簡介 3.1.2 Kettle的特點 3.2 Kettle的安裝與啟動 3.3 Kettle的轉(zhuǎn)換和作業(yè) 3.3.1 轉(zhuǎn)換 3.3.2 作業(yè) 3.4 Kettle的基本操作 3.4.1 轉(zhuǎn)換管理 3.4.2 作業(yè)管理 3.4.3 數(shù)據(jù)庫連接 3.5 本章小結(jié) 3.6 課后習(xí)題 第4章 數(shù)據(jù)抽取 4.1 從文件中抽取數(shù)據(jù) 4.1.1 從CSV文件中抽取數(shù)據(jù) 4.1.2 從TSV文件中抽取數(shù)據(jù) 4.1.3 從JSON文件中抽取數(shù)據(jù) 4.1.4 從XML文件中抽取數(shù)據(jù) 4.1.5 從HDFS中抽取數(shù)據(jù) 4.2 從數(shù)據(jù)庫中抽取數(shù)據(jù) 4.2.1 從關(guān)系數(shù)據(jù)庫中抽取數(shù)據(jù) 4.2.2 從非關(guān)系數(shù)據(jù)庫中抽取數(shù)據(jù) 4.3 從Hive中抽取數(shù)據(jù) 4.4 從HTML頁面中抽取數(shù)據(jù) 4.5 本章小結(jié) 4.6 課后習(xí)題 第5章 數(shù)據(jù)清洗 5.1 重復(fù)值處理 5.2 缺失值處理 5.2.1 缺失值處理策略 5.2.2 刪除缺失值 5.2.3 填補缺失值 5.3 異常值處理 5.3.1 刪除異常值 5.3.2 替換異常值 5.4 本章小結(jié) 5.5 課后習(xí)題 第6章 數(shù)據(jù)轉(zhuǎn)換 6.1 數(shù)據(jù)規(guī)范化處理 6.1.1 數(shù)據(jù)規(guī)范化處理概述 6.1.2 數(shù)據(jù)規(guī)范化處理過程 6.2 多數(shù)據(jù)源合并 6.2.1 多數(shù)據(jù)源合并方法 6.2.2 多數(shù)據(jù)源合并過程 6.3 數(shù)據(jù)粒度轉(zhuǎn)換 6.4 數(shù)據(jù)的商務(wù)規(guī)則計算 6.5 本章小結(jié) 6.6 課后習(xí)題 第7章 數(shù)據(jù)加載 7.1 將數(shù)據(jù)加載到文本文件 7.2 將數(shù)據(jù)加載到數(shù)據(jù)庫 7.2.1 將數(shù)據(jù)加載到關(guān)系數(shù)據(jù)庫 7.2.2 將數(shù)據(jù)加載到非關(guān)系數(shù)據(jù)庫 7.3 將數(shù)據(jù)加載到Hive 7.4 本章小結(jié) 7.5 課后習(xí)題 第8章 綜合案例——構(gòu)建電影租賃商店數(shù)據(jù)倉庫 8.1 案例概述 8.1.1 案例背景介紹 8.1.2 數(shù)據(jù)庫簡介 8.1.3 數(shù)據(jù)倉庫簡介 8.2 環(huán)境準(zhǔn)備 8.3 案例實現(xiàn) 8.3.1 向維度表dim_date加載數(shù)據(jù) 8.3.2 向維度表dim_time加載數(shù)據(jù) 8.3.3 向維度表dim_staff加載數(shù)據(jù) 8.3.4 向維度表dim_customer加載數(shù)據(jù) 8.3.5 向維度表dim_store加載數(shù)據(jù) 8.3.6 向維度表dim_actor加載數(shù)據(jù) 8.3.7 向維度表dim_film加載數(shù)據(jù) 8.3.8 向橋接表dimjilm_actor_bridge加載數(shù)據(jù) 8.3.9 向事實表fact_rental加載數(shù)據(jù) 8.3.10 定期向數(shù)據(jù)倉庫sakila_dwh加載數(shù)據(jù) 8.4 本章小結(jié)
展開全部

數(shù)據(jù)清洗(第2版) 作者簡介

黑馬程序員,是江蘇傳智播客教育科技股份有限公司旗下高端IT教育品牌,江蘇傳智播客教育科技股份有限公司是一家致力于培養(yǎng)高素質(zhì)軟件開發(fā)人才的科技公司。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服