智能數(shù)據(jù)治理——基于大模型、知識圖譜
定 價:68 元
- 作者:沈睿芳 等
- 出版時間:2025/1/1
- ISBN:9787121492877
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:248
- 紙張:
- 版次:01
- 開本:16開
本書基于我國深入實施網(wǎng)絡強國和國家大數(shù)據(jù)戰(zhàn)略的大背景,將“大語言模型”“知識圖譜”“數(shù)據(jù)治理”相結合,闡述了大模型、知識圖譜在智能數(shù)據(jù)治理中的應用實踐,并以醫(yī)療、政務及降碳等行業(yè)為例,詳細介紹了其數(shù)據(jù)治理流程及平臺構建方法。書中首先闡述了大模型時代知識圖譜和智能數(shù)據(jù)治理之間的協(xié)同關系,以兒童孤獨癥為例介紹了基于CiteSpace軟件的醫(yī)療知識圖譜的構建流程;其次詳細闡述了基于神經(jīng)網(wǎng)絡模型的個人健康管理知識圖譜的構建方法;最后介紹了主動式政務服務和降碳領域的智能數(shù)據(jù)治理平臺的設計與實現(xiàn),并在每一部分都介紹了大模型技術在各行業(yè)領域的應用實踐。本書將理論與實踐相結合,能更好地服務于我國經(jīng)濟社會發(fā)展和人民生活改善,可供信息管理及大數(shù)據(jù)領域的本科生、研究生、科研人員,以及各行業(yè)信息化和數(shù)據(jù)治理部門的專業(yè)技術人員參考。
沈睿芳,首都經(jīng)濟貿易大學管理工程學院講師,管理科學與工程專業(yè)博士,清華大學控制科學與工程專業(yè)博士后。近年來一直從事多學科領域的信息管理與大數(shù)據(jù)治理領域的教學及科研工作,并開展了多學科交叉領域的復雜系統(tǒng)建模與仿真、智能決策系統(tǒng)、網(wǎng)絡的生成與演化機制、知識圖譜與知識服務等方面的研究工作。近年來在國內外學術期刊及國際會議發(fā)表20余篇學術論文。作為主持或主要負責人參與多項國家科技支撐計劃、國家自然科學基金和企業(yè)橫向課題、北京市自然科學基金、北京市教委計劃項目、河北省科技廳等科研項目。
目錄
第1章 數(shù)據(jù)治理 //1
1.1 數(shù)據(jù)治理概述 //1
1.1.1 數(shù)據(jù)治理概念 //1
1.1.2 數(shù)據(jù)治理要素 //2
1.2 數(shù)據(jù)治理模型 //3
1.2.1 DGI數(shù)據(jù)治理框架 //4
1.2.2 HESA數(shù)據(jù)治理模型 //6
1.2.3 漸進式數(shù)據(jù)治理模型 //7
1.3 智能數(shù)據(jù)治理 //8
1.3.1 傳統(tǒng)數(shù)據(jù)治理與智能數(shù)據(jù)治理 //8
1.3.2 數(shù)據(jù)驅動概述 //8
1.3.3 智能數(shù)據(jù)治理解決方案 //9
1.4 數(shù)據(jù)架構與智能數(shù)據(jù)治理架構 //10
1.4.1 企業(yè)架構與數(shù)據(jù)架構 //10
1.4.2 智能數(shù)據(jù)治理架構 //14
第2章 知識圖譜 //16
2.1 知識圖譜概述 //16
2.1.1 知識圖譜的演進 //16
2.1.2 知識圖譜的體系架構 //17
2.2 知識的存儲 //18
2.2.1 知識表示框架及查詢語言 //18
2.2.2 基于表結構的存儲方案 //20
2.2.3 基于圖結構的存儲方案 //22
2.3 知識表示 //24
2.3.1 一階謂詞邏輯 //24
2.3.2 產(chǎn)生式系統(tǒng) //25
2.3.3 框架表示法 //25
2.3.4 語義網(wǎng)絡表示法 //27
2.4 知識抽取 //28
2.4.1 實體抽取 //28
2.4.2 關系抽取 //31
2.4.3 事件抽取 //34
2.5 知識融合 //36
2.6 知識推理 //37
2.6.1 基于邏輯規(guī)則的推理 //38
2.6.2 基于圖結構的推理 //38
2.6.3 基于分布式表示的推理 //39
2.6.4 基于神經(jīng)網(wǎng)絡的推理 //39
2.6.5 混合推理 //40
2.7 知識挖掘 //41
2.7.1 知識內容挖掘:實體鏈接 //41
2.7.2 知識結構挖掘:規(guī)則鏈接 //44
第3章 大模型時代的知識圖譜和智能數(shù)據(jù)治理 //47
3.1 知識圖譜與人工智能 //47
3.1.1 知識圖譜是人工智能的基石 //47
3.1.2 知識圖譜推動智能應用 //48
3.1.3 知識圖譜是人工智能發(fā)展的核心驅動之一 //48
3.2 知識圖譜與數(shù)據(jù)治理 //48
3.2.1 良好的數(shù)據(jù)治理是構建組織知識圖譜的基石 //48
3.2.2 知識圖譜助力智能數(shù)據(jù)治理 //49
3.2.3 基于知識圖譜的智能數(shù)據(jù)治理架構 //50
3.3 大模型時代的知識圖譜和數(shù)據(jù)治理 //51
3.3.1 大模型概述 //51
3.3.2 大模型中的關鍵技術 //52
3.3.3 大模型的優(yōu)勢及特點 //54
3.3.4 常見的大模型 //55
3.3.5 基于大模型的智能系統(tǒng)架構 //57
3.4 大模型時代的知識圖譜 //59
3.4.1 知識圖譜和大模型面臨的現(xiàn)實困境和融合機遇 //59
3.4.2 知識圖譜和大模型融合應用的三種主流模式 //64
3.4.3 大模型和知識圖譜 //67
3.4.4 大模型與知識圖譜的協(xié)同技術 //68
3.4.5 基于大模型的智能知識圖譜架構 //69
3.5 大模型時代的智能數(shù)據(jù)治理 //74
3.5.1 傳統(tǒng)的數(shù)據(jù)治理技術 //75
3.5.2 數(shù)據(jù)治理為大模型奠定基礎 //78
3.5.3 大模型在數(shù)據(jù)治理中的應用 //78
3.5.4 面向大模型的數(shù)據(jù)治理框架 //81
3.5.5 基于大模型的智能數(shù)據(jù)治理 //83
3.6 基于領域知識圖譜的數(shù)據(jù)治理架構 //84
3.6.1 醫(yī)療領域的智能數(shù)據(jù)治理 //84
3.6.2 政務領域的智能數(shù)據(jù)治理 //85
3.6.3 低碳領域的智能數(shù)據(jù)治理 //86
3.6.4 基于知識圖譜的智能知識服務 //86
第4章 醫(yī)療領域科學知識圖譜繪制 //88
4.1 科學知識圖譜概述 //89
4.1.1 知識圖譜分析方法 //89
4.1.2 知識圖譜繪制工具 //90
4.2 CiteSpace概述 //91
4.2.1 軟件主界面 //91
4.2.2 合作網(wǎng)絡分析 //92
4.2.3 中文CNKI數(shù)據(jù)的分析實踐 //97
4.3 醫(yī)療知識圖譜構建 //101
4.4 兒童孤獨癥知識圖譜分析 //103
4.4.1 兒童孤獨癥學科共引分析 //103
4.4.2 兒童孤獨癥知識基礎知識圖譜分析 //105
4.4.3 兒童孤獨癥研究領域的核心期刊 //107
4.4.4 兒童孤獨癥研究機構分析 //109
4.4.5 基于CiteSpace的兒童孤獨癥知識庫關鍵知識點分析 //111
第5章 數(shù)據(jù)驅動的兒童孤獨癥主動知識服務模型構建 //121
5.1 兒童孤獨癥篩查與干預平臺構建 //121
5.1.1 建立基于眾包模式的孤獨癥患兒信息庫及知識庫 //122
5.1.2 建立兒童孤獨癥知識服務個性化推薦模型 //124
5.2 區(qū)域兒童孤獨癥篩查與干預數(shù)據(jù)治理實施架構 //125
5.3 知識庫本體構建及知識爬取方法概述 //127
5.3.1 本體構建方法 //127
5.3.2 知識爬取方法 //130
5.4 孤獨癥本體構建 //131
5.4.1 孤獨癥本體框架 //131
5.4.2 孤獨癥本體構建 //133
5.5 基于Heritrix和HTMLParser的孤獨癥知識文本提取 //136
5.5.1 爬蟲解析過程 //137
5.5.2 算法優(yōu)化 //139
5.6 孤獨癥疾病領域知識庫結構 //140
第6章 個人健康信息知識圖譜構建 //143
6.1 電子病歷概述 //143
6.1.1 電子病歷文本類型 //143
6.1.2 電子病歷實體分類 //143
6.1.3 電子病歷實體關系分類 //144
6.2 模型與方法 //145
6.2.1 基于轉換器的雙向編碼器表示 //145
6.2.2 條件隨機場 //146
6.2.3 長短期記憶網(wǎng)絡 //147
6.2.4 注意力機制模型 //149
6.2.5 CNN //150
6.3 電子病歷命名實體識別 //150
6.3.1 BiLSTM-CRF模型原理 //150
6.3.2 BiLSTM-CRF模型的構建 //152
6.3.3 電子病歷實體數(shù)據(jù)預處理 //153
6.3.4 結果分析 //155
6.4 電子病歷關系抽取 //156
6.4.1 CNN構建 //156
6.4.2 電子病歷關系數(shù)據(jù)預處理 //157
6.4.3 結果分析 //158
6.5 電子病歷關系抽取 //160
6.5.1 Neo4j圖數(shù)據(jù)庫 //160
6.5.2 Neo4j圖數(shù)據(jù)庫存儲 //160
6.6 大模型在健康管理領域的應用 //164
6.6.1 國內外典型醫(yī)療大模型 //165
6.6.2 醫(yī)學臨床數(shù)據(jù)治理 //166
6.6.3 智能病理診斷 //168
6.6.4 疾病風險預測與醫(yī)療資源管理 //169
6.6.5 大模型助力醫(yī)院構建智慧醫(yī)護體系 //170
第7章 政務服務數(shù)據(jù)治理平臺構建 //173
7.1 主動式政務服務需求 //173
7.1.1 主動式政務服務 //173
7.1.2 個性化政務服務 //174
7.1.3 移動政務服務 //174
7.2 主動式政務服務數(shù)據(jù)治理平臺構建 //174
7.2.1 多源數(shù)據(jù)整合 //175
7.2.2 政務服務云平臺總體架構 //176
7.3 模式創(chuàng)新 //177
7.3.1 主動式政務服務模式創(chuàng)新 //177
7.3.2 管理模式創(chuàng)新 //179
7.4 主動式政務服務云平臺構建案例 //182
7.4.1 基于“三單管理”的標準化審批服務 //182
7.4.2 基于“網(wǎng)格化”的智慧城市治理新模式 //183
7.5 大模型在智慧政務領域的應用 //183
7.5.1 智能政務服務 //184
7.5.2 城市智能化治理 //185
7.5.3 應用大模型技術打造政府網(wǎng)站智能問答服務 //187
第8章 低碳領域的數(shù)據(jù)治理 //192
8.1 低碳領域數(shù)據(jù)構成 //192
8.1.1 能源消耗類數(shù)據(jù) //192
8.1.2 碳源類數(shù)據(jù) //194
8.1.3 碳匯類數(shù)據(jù) //195
8.2 知識圖譜和區(qū)塊鏈應用策略 //195
8.2.1 知識圖譜和區(qū)塊鏈技術概述 //195
8.2.2 知識圖譜在低碳數(shù)據(jù)治理中的應用策略 //196
8.2.3 區(qū)塊鏈在低碳數(shù)據(jù)治理中的應用策略 //197
8.3 數(shù)據(jù)治理平臺需求 //198
8.3.1 問題分析 //198
8.3.2 業(yè)務性需求 //199
8.3.3 功能性需求 //200
8.3.4 低碳數(shù)據(jù)治理系統(tǒng)軟硬件配置要求 //201
8.3.5 低碳數(shù)據(jù)治理系統(tǒng)性能需求 //201
8.4 低碳數(shù)據(jù)治理系統(tǒng)的設計與實現(xiàn) //203
8.4.1 總體框架設計 //203
8.4.2 數(shù)據(jù)庫設計 //205
8.4.3 各功能模塊設計與實現(xiàn) //213
8.5 低碳數(shù)據(jù)治理系統(tǒng)構建示例 //222
8.5.1 應用效果 //222
8.5.2 小結 //228
8.6 大模型在低碳數(shù)據(jù)治理領域的應用 //228
8.6.1 綠色電力系統(tǒng)優(yōu)化 //228
8.6.2 智慧農業(yè)生產(chǎn)作業(yè) //229
8.6.3 有色冶金能源管理 //230
8.6.4 新能源汽車智能制造 //230
8.6.5 智能建造設計裝配 //231
8.6.6 大模型助力建筑行業(yè)智能化轉型升級 //232
參考文獻 //234