書馨卡幫你省薪 2024個人購書報告 2024中圖網(wǎng)年度報告
歡迎光臨中圖網(wǎng) 請 | 注冊

數(shù)據(jù)湖倉

出版社:人民郵電出版社出版時間:2024-07-01
開本: 32開 頁數(shù): 180
中 圖 價:¥35.4(7.1折) 定價  ¥49.8 登錄后可看到會員價
加入購物車 收藏
運費6元,滿39元免運費
?新疆、西藏除外
本類五星書更多>

數(shù)據(jù)湖倉 版權(quán)信息

數(shù)據(jù)湖倉 本書特色

1.本書的一作為比爾·恩門,被譽為“數(shù)據(jù)倉庫之父”,先提出數(shù)據(jù)倉庫概念的學者,在數(shù)據(jù)庫技術(shù)管理與數(shù)據(jù)庫設計方面擁有超過35年的經(jīng)驗。 2.本書由國際專業(yè)的數(shù)據(jù)管理專業(yè)團體DAMA中國團隊翻譯。 3.本書涵蓋數(shù)據(jù)湖倉的多個主題,包括基本概念、應用領(lǐng)域和案例分析等,內(nèi)容豐富多樣,語言易懂簡潔,能夠滿足不同領(lǐng)域讀者的需求。 4.本書不僅介紹數(shù)據(jù)湖倉構(gòu)建的理論知識,而且包含非常有趣的案例分析,可以幫助讀者更好地理解理論知識在實際問題中的應用。

數(shù)據(jù)湖倉 內(nèi)容簡介

數(shù)據(jù)湖倉是下一代數(shù)據(jù)倉庫和數(shù)據(jù)湖,旨在滿足復雜多變的現(xiàn)代信息系統(tǒng)的需求。本書主要展示了如何構(gòu)建作為人工智能、機器學習和數(shù)據(jù)網(wǎng)格的基礎的數(shù)據(jù)湖倉,同時介紹了數(shù)據(jù)湖倉的缺陷和使用技巧,以*大限度地提高數(shù)據(jù)湖倉的商業(yè)價值。
在本書中,我們將深入探討數(shù)據(jù)湖倉的核心特性及其成功的關(guān)鍵因素。首先,我們將認識到數(shù)據(jù)質(zhì)量的重要性,并通過檢查輸入錯誤、解決鍵的非兼容性問題以及維護良好的文檔編制來提高數(shù)據(jù)的質(zhì)量和可信度。其次,我們將學習數(shù)據(jù)湖倉的不同存儲類型,包括未充分利用但極具價值的大容量存儲器。我們也將針對數(shù)據(jù)湖倉中的3種主要數(shù)據(jù)類型——結(jié)構(gòu)化數(shù)據(jù)、文本數(shù)據(jù)和模擬/物聯(lián)網(wǎng)數(shù)據(jù),學習如何為人工智能、機器學習和數(shù)據(jù)網(wǎng)格構(gòu)建堅實的基礎。同時,我們將探討如何利用針對結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)模型、針對文本數(shù)據(jù)的本體和分類標準,以及針對模擬/物聯(lián)網(wǎng)數(shù)據(jù)的數(shù)據(jù)蒸餾算法,來抽象化這些數(shù)據(jù),以滿足未來的業(yè)務需求。*后,我們將學習如何應用ETL技術(shù)解決數(shù)據(jù)轉(zhuǎn)換問題,確保構(gòu)建一個高效、滿足業(yè)務需求的數(shù)據(jù)湖倉。

數(shù)據(jù)湖倉 目錄

第 1章 讓數(shù)據(jù)可信 1 1.1 做一個成熟的終端用戶 2 1.2 不斷攀升的可信目標 5 1.3 可信數(shù)據(jù)的要素 7 1.4 小結(jié) 8 第 2章 基礎數(shù)據(jù) 9 2.1 構(gòu)建應用程序 9 2.2 以人工智能醫(yī)療為例 10 2.3 基礎數(shù)據(jù)的組成要素 12 2.4 小結(jié) 14 第3章 如何避免不良數(shù)據(jù) 15 3.1 輸入錯誤 16 3.2 鍵的問題 18 3.3 重復記錄 18 3.4 拼寫錯誤 19 3.5 兼容性 19 3.6 編制文檔 21 3.7 小結(jié) 22 第4章 不同類型的數(shù)據(jù) 24 4.1 數(shù)據(jù)量 24 4.2 數(shù)據(jù)的業(yè)務價值 25 4.3 數(shù)據(jù)的訪問概率 27 4.4 數(shù)據(jù)降級 29 4.5 基于大容量存儲器的數(shù)據(jù)歸檔機制 30 4.6 小結(jié) 30 第5章 數(shù)據(jù)抽象 31 5.1 結(jié)構(gòu)化數(shù)據(jù)模型 32 5.2 本體和分類標準 34 5.3 模擬/物聯(lián)網(wǎng)數(shù)據(jù)的蒸餾算法 36 5.4 小結(jié) 37 第6章 結(jié)構(gòu)化數(shù)據(jù) 39 6.1 業(yè)務交易生成的數(shù)據(jù) 40 6.2 結(jié)構(gòu)化記錄 40 6.3 鍵 42 6.4 聯(lián)機事務處理 43 6.5 組織數(shù)據(jù) 45 6.6 小結(jié) 46 第7章 文本數(shù)據(jù) 48 7.1 文本數(shù)據(jù)的類型 48 7.2 使用文本數(shù)據(jù)時的語言障礙 50 7.3 多義詞 51 7.4 提取業(yè)務的含義 51 7.5 小結(jié) 54 第8章 模擬/物聯(lián)網(wǎng)數(shù)據(jù) 56 8.1 數(shù)據(jù)有用性的差異 57 8.2 攝像頭 58 8.3 人工審視 59 8.4 日期分隔 60 8.5 數(shù)據(jù)篩選 61 8.6 閾值方法 61 8.7 時間排序方法 62 8.8 小結(jié) 63 第9章 大容量存儲器與數(shù)據(jù)湖倉 65 9.1 大容量存儲器的優(yōu)缺點 66 9.2 訪問概率 67 9.3 索引 70 9.4 元數(shù)據(jù)和大容量存儲器 71 9.5 小結(jié) 71 第 10章 數(shù)據(jù)架構(gòu)與數(shù)據(jù)工程 73 10.1 兩個角色如何通力配合 74 10.2 角色與數(shù)據(jù)類型 75 10.3 小結(jié) 79 第 11章 業(yè)務價值 81 11.1 業(yè)務價值才是驅(qū)動力 81 11.2 一切都離不開錢 82 11.3 基礎數(shù)據(jù) 83 11.4 難以協(xié)調(diào) 84 11.5 領(lǐng)域 85 11.6 小結(jié) 86 第 12章 數(shù)據(jù)需要的層次 87 12.1 數(shù)據(jù)獲取 89 12.2 數(shù)據(jù)傳輸與存儲 90 12.3 數(shù)據(jù)轉(zhuǎn)換 91 12.4 數(shù)據(jù)標簽、整合與匯聚 92 12.5 數(shù)據(jù)分析與機器學習 93 12.6 小結(jié) 95 第 13章 數(shù)據(jù)湖倉中的數(shù)據(jù)集成 97 13.1 不同種類數(shù)據(jù)的集成 98 13.2 自動集成 98 13.3 ETL 99 13.4 文本ETL 101 13.5 數(shù)據(jù)蒸餾算法 103 13.6 小結(jié) 104 第 14章 分析 105 14.1 結(jié)構(gòu)化數(shù)據(jù)分析 105 14.2 文本數(shù)據(jù)分析 107 14.3 模擬/物聯(lián)網(wǎng)數(shù)據(jù)分析 108 14.4 結(jié)構(gòu)化數(shù)據(jù)和文本數(shù)據(jù)的結(jié)合 109 14.5 連接3個環(huán)境 111 14.6 執(zhí)行分析 112 14.7 小結(jié) 113 第 15章 軟數(shù)據(jù) 114 15.1 電子表格數(shù)據(jù) 115 15.2 互聯(lián)網(wǎng)數(shù)據(jù) 116 15.3 政府數(shù)據(jù) 117 15.4 小結(jié) 117 第 16章 描述性數(shù)據(jù) 119 16.1 數(shù)據(jù)模型 121 16.2 元數(shù)據(jù) 122 16.3 結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換 123 16.4 結(jié)構(gòu)化數(shù)據(jù)源 124 16.5 數(shù)據(jù)選擇標準 125 16.6 數(shù)據(jù)定義語言 125 16.7 數(shù)據(jù)編碼 126 16.8 數(shù)據(jù)關(guān)系 127 16.9 文本數(shù)據(jù) 128 16.10 本體 129 16.11 分類標準 131 16.12 關(guān)聯(lián) 132 16.13 上下文情境 133 16.14 文本數(shù)據(jù)源 134 16.15 模擬/物聯(lián)網(wǎng)數(shù)據(jù) 135 16.16 算法 136 16.17 閾值 136 16.18 時間排序 137 16.19 模擬/物聯(lián)網(wǎng)數(shù)據(jù)源 138 16.20 數(shù)據(jù)血緣 138 16.21 小結(jié) 139 第 17章 數(shù)據(jù)目錄 140 17.1 永久維護 141 17.2 開放 141 17.3 不同數(shù)據(jù)類型的內(nèi)部結(jié)構(gòu) 142 17.4 小結(jié) 143 第 18章 數(shù)據(jù)架構(gòu)的演化 144 18.1 伊始 144 18.2 應用程序 145 18.3 磁帶文件 146 18.4 硬盤存儲 147 18.5 OLTP 148 18.6 個人計算機 149 18.7 4GL處理技術(shù)和數(shù)據(jù)抽取應用程序 150 18.8 數(shù)據(jù)倉庫 152 18.9 數(shù)據(jù)集市 153 18.10 互聯(lián)網(wǎng)和物聯(lián)網(wǎng)數(shù)據(jù) 154 18.11 數(shù)據(jù)湖 155 18.12 數(shù)據(jù)湖倉 157 18.13 小結(jié) 158
展開全部

數(shù)據(jù)湖倉 作者簡介

比爾·恩門,被譽為“數(shù)據(jù)倉庫之父”,出版了60本書并被譯為多種語言,《計算機世界》將他評為計算機專業(yè)歷史上具影響力的十大人物之一。 戴夫·拉皮恩,是辛辛那提大學林德納商學院的副教授,有著超過25年的教學經(jīng)驗,還開發(fā)和管理了許多不同行業(yè)的大規(guī)模數(shù)據(jù)集成系統(tǒng)。 瓦萊麗·巴特爾特,在印第安納大學凱利商學院獲得信息系統(tǒng)博士學位和商業(yè)碩士學位,并且在電信學院獲得了沉浸式媒介環(huán)境碩士學位。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服