-
>
湖南省志(1978-2002)?鐵路志
-
>
公路車寶典(ZINN的公路車維修與保養(yǎng)秘籍)
-
>
晶體管電路設計(下)
-
>
基于個性化設計策略的智能交通系統(tǒng)關鍵技術
-
>
德國克虜伯與晚清火:貿易與仿制模式下的技術轉移
-
>
花樣百出:貴州少數民族圖案填色
-
>
識木:全球220種木材圖鑒
工業(yè)數據分析工程:基于CRISP-DM的形式化方法 版權信息
- ISBN:9787111759799
- 條形碼:9787111759799 ; 978-7-111-75979-9
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
工業(yè)數據分析工程:基于CRISP-DM的形式化方法 本書特色
《工業(yè)數據分析工程:基于CRISP-DM的形式化方法》是一本專為希望利用數據科學推動工業(yè)進步的專業(yè)人士撰寫的指南。本書深入淺出地介紹了如何運用跨行業(yè)標準流程(CRISP-DM)來解決工業(yè)領域中復雜的數據分析問題。通過系統(tǒng)性地介紹CRISP-DM的六個階段——業(yè)務理解、數據理解、數據準備、建模、評估和部署,本書不僅提供了理論框架,還輔以豐富的實際案例研究,幫助讀者將理論知識轉化為實踐能力。
作者精心挑選了豐富的實例,展示了如何在這些行業(yè)中有效地實施數據分析項目。無論是初學者還是經驗豐富的工程師,都能從中學到如何更好地處理數據、構建模型,并將結果應用于決策制定過程。
如果您是尋求提高工廠效率、優(yōu)化供應鏈管理或改進產品質量的數據科學家、工程師或是企業(yè)領導者,《工業(yè)數據分析工程:基于CRISP-DM的形式化方法》無疑是您的bi備參考書。它將引導您掌握一套全面而實用的方法論,幫助您在工業(yè)4.0時代取得競爭優(yōu)勢。
工業(yè)數據分析工程:基于CRISP-DM的形式化方法 內容簡介
在“數據資產化”“工業(yè)互聯網”“工業(yè)大數據”的推進中,工業(yè)大數據分析仍缺乏統(tǒng)一的指導方法,造成工業(yè)大數據分析項目質量波動大落地成功率低。CRISP-DM方法是機器學習領域的行業(yè)事實標準,但CRISP-DM 僅僅是過程方法,對于每個階段或關鍵活動,沒有給出具體的行動指導。本書在 CRISP-DM 基礎上,細化了工業(yè)數據分析中的具體活動,針對關鍵活動提出了明確的形式化方法(例如,用系統(tǒng)動力學模型刻畫工業(yè)物理系統(tǒng)的運行機理,用領域模型描述物理系統(tǒng)間的概念關系,用數據處理流圖描述分析模型間的數據處理和依賴關系),并用具體的行業(yè)案例進行闡述,嘗試為工業(yè)大數據分析構建一套實操性的工程方法體系。
《工業(yè)數據分析工程:基于CRISP-DM的形式化方法》分為 10 章:第1章概要介紹工業(yè)數據分析方法體系;第2~7章討論了分析場景定義、業(yè)務理解、數據理解、數據準備、模型建立、模型評估和模型部署7個階段的關鍵活動、關鍵角色和成功標準,給出實操形式化方法,并用具體工業(yè)案例進行展示;第8~10章用3個不同類型行業(yè)案例,端到端展示了工業(yè)數據分析方法的應用過程。本書是實操性方法的系統(tǒng)總結,用實際案例將讀者代人,更好地理解問題的挑戰(zhàn)和解決過程在此基礎上,進行系統(tǒng)化總結,方便方法的傳承。在“數據資產化”“工業(yè)互聯網”“工業(yè)大數據”的推進中,工業(yè)大數據分析仍缺乏統(tǒng)一的指導方法,造成工業(yè)大數據分析項目質量波動大落地成功率低。CRISP-DM方法是機器學習領域的行業(yè)事實標準,但CRISP-DM 僅僅是過程方法,對于每個階段或關鍵活動,沒有給出具體的行動指導。本書在 CRISP-DM 基礎上,細化了工業(yè)數據分析中的具體活動,針對關鍵活動提出了明確的形式化方法(例如,用系統(tǒng)動力學模型刻畫工業(yè)物理系統(tǒng)的運行機理,用領域模型描述物理系統(tǒng)間的概念關系,用數據處理流圖描述分析模型間的數據處理和依賴關系),并用具體的行業(yè)案例進行闡述,嘗試為工業(yè)大數據分析構建一套實操性的工程方法體系。
《工業(yè)數據分析工程:基于CRISP-DM的形式化方法》分為 10 章:第1章概要介紹工業(yè)數據分析方法體系;第2~7章討論了分析場景定義、業(yè)務理解、數據理解、數據準備、模型建立、模型評估和模型部署7個階段的關鍵活動、關鍵角色和成功標準,給出實操形式化方法,并用具體工業(yè)案例進行展示;第8~10章用3個不同類型行業(yè)案例,端到端展示了工業(yè)數據分析方法的應用過程。本書是實操性方法的系統(tǒng)總結,用實際案例將讀者代人,更好地理解問題的挑戰(zhàn)和解決過程在此基礎上,進行系統(tǒng)化總結,方便方法的傳承。
《工業(yè)數據分析工程:基于CRISP-DM的形式化方法》適合工業(yè)大數據從業(yè)者,包括工業(yè)大數據/工業(yè)互聯網企業(yè)的研發(fā)人員、工業(yè)企業(yè)T部門及數字化轉型部門的工程技術人員閱讀,也適合高等或職業(yè)院校的大數據或工業(yè)互聯網相關專業(yè)的教師和學生閱讀。
工業(yè)數據分析工程:基于CRISP-DM的形式化方法 目錄
1.工業(yè)數據分析方法概述
1.1.方法論內涵與作用
1.2.工業(yè)大數據項目落地的載體
1.2.1.大數據分析的3種載體形式:數據服務、模型服務、智能應用
1.2.2.工業(yè)大數據項目的價值落地
1.2.3.智能化項目管理
1.3.工業(yè)數據分析過程方法
1.4.如何用好工業(yè)數據分析方法
1.4.1.大數據分析方法的應用范疇
1.4.2.大數據分析方法與項目管理
1.4.3.大數據分析項目階段劃分
參考文獻
2.分析場景定義
2.1.什么是分析場景
2.2.分析場景識別
2.2.1.自頂向下的結構化分解法
2.2.2.自下向上的歸納剖析法
2.2.3.數據驅動的業(yè)務能力匹配法
2.2.4.分析場景識別中的常見問題
2.3.分析場景篩選
2.3.1.基于基線思維的場景篩選法
2.3.2.基于要素-認知矩陣的場景篩選法
2.3.3.分析場景篩選中的常見問題
2.4.分析場景定義示例
2.4.1.智能運維:自頂向下的結構化分解法
2.4.2.汽車制造:自下向上的歸納剖析法
2.4.3.電動礦卡智能管理:數據驅動的業(yè)務能力匹配法
參考文獻
3.業(yè)務理解
3.1.業(yè)務理解的目標
3.1.1.形成分析課題描述
3.1.2.提出數據需求清單
3.2.業(yè)務理解的主要內容
3.2.1.決策邏輯
3.2.2.決策場景
3.2.3.領域概念
3.3.業(yè)務理解的形式化模型
3.3.1.層次分解模型-列表
3.3.2.層次分解模型-樹狀結構
3.3.3.系統(tǒng)動力學模型
3.3.4.專家規(guī)則
3.3.5.運籌學模型
3.4.系統(tǒng)動力學的建模方法
3.4.1.系統(tǒng)動力學圖的建模過程
3.4.2.系統(tǒng)動力學建模背后的支撐技術
3.4.3.系統(tǒng)動力學模型的概念辨析
3.5.專家規(guī)則的建模方法
3.5.1.基于規(guī)則流的規(guī)則描述方法
3.5.2.基于邏輯表達式的規(guī)則檢驗方法
3.6.領域模型的建模方法
3.6.1.數據驅動的領域建模
3.6.2.業(yè)務驅動的領域建模
3.7.業(yè)務理解的執(zhí)行策略
3.7.1.了解性訪談
3.7.2.基于樣例數據的業(yè)務理解
3.7.3.確認性訪談
3.8.思考:業(yè)務理解中形式化模型的必要性
3.8.1.水箱水位預測的例子
3.8.2.發(fā)電機冷卻水溫度區(qū)間估計的例子
參考文獻
4.數據理解
4.1.數據收集
4.1.1.明確數據源系統(tǒng)和訪問方式
4.1.2.明確數據更新與存儲周期
4.2.數據描述-數據集層面的理解
4.2.1.樣本數據的人工閱讀
4.2.2.數據概覽
4.2.3.領域模型與數據模型交互理解
4.3.數據探索-數據字段層面的理解
4.3.1.統(tǒng)計分布
4.3.2.數據可視化
4.4.數據探索-業(yè)務層面的理解
4.4.1.業(yè)務維度組合的探索(基于領域模型)
4.4.2.業(yè)務過程理解(基于系統(tǒng)動力學模型)
4.4.3.專家知識的復現
4.5.數據質量審查
4.5.1.示例案例
4.5.2.基于領域模型的質量審查方法
4.5.3.分析項目中數據質量突出的原因
4.5.4.數據質量評價與影響分析
4.6.數據理解階段的執(zhí)行策略
4.6.1.執(zhí)行路徑
4.6.2.軟件工具
4.6.3.典型的數據處理技巧
參考文獻
5.數據準備
5.1.數據流設計
5.1.1.數據倉庫建模
5.1.2.領域模型驅動的工業(yè)數據組織方法
5.1.3.工業(yè)數據分析的數據流圖
5.1.4.分析數據流圖示例
5.2.數據選擇與清洗
5.3.數據融合
5.4.特征提取與選擇
5.4.1.特征的來源
5.4.2.特征提取的推進思路
5.5.數據資源化:數據分析師的視角
參考文獻
6.模型建立
6.1.常用的算法
6.2.目標變量的相關問題
6.2.1.目標變量的構建
6.2.2.目標變量變換
6.2.3.不均衡問題
6.3.預測變量的相關問題
6.3.1.工況切分
6.3.2.變量的離散化
6.3.3.移除沒有業(yè)務意義的高相關特征量
6.3.4.特征變量組合
6.3.5.類別變量的完備度
6.4.工業(yè)分析建模問題
6.4.1.基準模型
6.4.2.大量測點的穩(wěn)定過程建模
6.4.3.基于樸素道理的深度網絡結構參數優(yōu)化
6.4.4.時序分類問題
6.4.5.非監(jiān)督學習問題
6.4.6.優(yōu)化問題
6.4.7.評價型問題
6.4.8.淺機理、高維度的診斷型問題
6.5.機理模型與統(tǒng)計模型的結合方法
6.5.1.機理模型的范疇:定性與定量機理
6.5.2.統(tǒng)計模型與數學模型的4種融合范式
6.5.3.統(tǒng)計模型與仿真模型的2種融合模式
6.5.4.統(tǒng)計模型與經驗性機理模型的融合
參考文獻
7.模型評價與部署
7.1.模型評價的內容
7.2.技術評價
7.3.業(yè)務評價
7.4.下一步工作規(guī)劃
7.5.模型部署的內容
7.6.部署包的設計
7.6.1.分析任務的邏輯審查
7.6.2.數據異常的影響分析與應對措施
7.6.3.分析模型打包
7.7.模型運維機制設計
7.8.分析課題總結
參考文獻
8. 機器學習融合的設計模式
8.1 機器學習融合設計模式的來源和分類
8.2 業(yè)務邏輯與機器學習融合
8.2.1 業(yè)務狀態(tài)機模式
8.2.2 關聯規(guī)則發(fā)現模式
8.3 機理知識與機器學習融合
8.3.1 機理矯正模式
8.3.2 機理正則化約束模式
8.4 運籌優(yōu)化與機器學習融合
8.4.1 啟發(fā)策略增強模式
8.4.2 代理模型輔助優(yōu)化模式
參考文獻
9.風功率曲線分析
9.1.業(yè)務理解
9.1.1.環(huán)境要素
9.1.2.風況要素
9.1.3.控制系統(tǒng)的要素
9.1.4.設計與安裝要素
9.2.風功率曲線擬合-數據理解
9.2.1.功率曲線預覽
9.2.2.多變量關系
9.3.風功率曲線擬合-數據準備
9.3.1.對風速做分倉
9.3.2.對有功功率做分倉
9.3.3.改進方向
9.4.風功率曲線擬合-回歸模型
9.5.風功率曲線異常點識別-數據理解
9.5.1.數據說明
9.5.2.單臺風機
工業(yè)數據分析工程:基于CRISP-DM的形式化方法 作者簡介
田春華
博士,北京工業(yè)大數據創(chuàng)新中心首席數據科學家,清華大學工業(yè)大數據研究中心,首席數據科學家;曾任IBM中國研究院研究經理,IEEE、INFORMS、ACM等學術組織及國際學術會議分會主席、執(zhí)行委員、國際學術期刊審稿人。長期負責數據挖掘算法研究和產品工作,在高端裝備制造、石油石化、新能源、航空與港口等行業(yè),幫助幾十家國內外領先企業(yè)成功實施資產管理、運營優(yōu)化、營銷洞察等數據分析項目。參與了多個工業(yè)大數據相關標準的制定工作、白皮書的編寫工作、競賽支持工作。發(fā)表論文近百篇,擁有40余項國際國內發(fā)明專利授權。
- >
朝聞道
- >
小考拉的故事-套裝共3冊
- >
伊索寓言-世界文學名著典藏-全譯本
- >
詩經-先民的歌唱
- >
名家?guī)阕x魯迅:朝花夕拾
- >
中國歷史的瞬間
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
姑媽的寶刀