知識圖譜已在多個(gè)領(lǐng)域深耕多年,然而,現(xiàn)有的典型知識圖譜主要是以實(shí)體及其屬性和關(guān)系為研究核心,缺乏對事理邏輯這一重要人類知識的刻畫。為了彌補(bǔ)這一不足,事理圖譜應(yīng)運(yùn)而生,它能夠揭示事件的演化規(guī)律和發(fā)展邏輯,刻畫和記錄人類行為活動。事理圖譜是較為典型的多學(xué)科交叉領(lǐng)域,涉及知識工程、自然語言處理、機(jī)器學(xué)習(xí)、圖數(shù)據(jù)庫等多個(gè)領(lǐng)域。本書系統(tǒng)地介紹事理圖譜涉及的概念和關(guān)鍵技術(shù),如事理圖譜概述、事理知識表示、事件抽取、事件模式的自動歸納、事件關(guān)系抽取、事件表示學(xué)習(xí)、事件泛化及事理歸納、事理知識存儲和檢索、基于事理圖譜的認(rèn)知推理與預(yù)測、基于事理圖譜的問答與對話等。此外,本書還嘗試將學(xué)術(shù)前沿和實(shí)戰(zhàn)結(jié)合,讓讀者在掌握實(shí)際應(yīng)用能力的同時(shí)對前沿技術(shù)發(fā)展有所了解。本書主要面向高年級本科生和研究生,可以作為知識圖譜相關(guān)課程的教材,也可以作為對事理圖譜感興趣的讀者的入門讀物。
丁效,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、社會計(jì)算與信息檢索研究中心副主任。主要研究方向?yàn)槿斯ぶ悄堋⒆匀徽Z言處理、事理圖譜、因果推理。在TKDE、ACL、AAAI、IJCAI等人工智能領(lǐng)域的頂級國際期刊和會議上發(fā)表相關(guān)論文80余篇,承擔(dān)國家部委項(xiàng)目、科技部科技創(chuàng)新2030—“新一代人工智能”重大項(xiàng)目課題、國家自然科學(xué)基金重點(diǎn)項(xiàng)目課題、面上項(xiàng)目、黑龍江省優(yōu)青項(xiàng)目等多項(xiàng)省部級以上項(xiàng)目。獲國家級教學(xué)成果二等獎,黑龍江省科學(xué)技術(shù)一等獎,黑龍江省科學(xué)技術(shù)二等獎,ACL 2024杰出論文獎,SemEval 2020國際語義評測“檢測反事實(shí)陳述”任務(wù)第一名,入選2022年AI 2000全球人工智能最具影響力學(xué)者、華為云AI名師獎等,擔(dān)任中國中文信息學(xué)會社會媒體處理專委會秘書長、黑龍江省中文信息處理重點(diǎn)實(shí)驗(yàn)室副主任等職務(wù)。劉挺,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、副校長,國家高層次人才。工業(yè)和信息化部高新技術(shù)司“智能機(jī)器人”專家組專家、電子信息科學(xué)技術(shù)委員會信息服務(wù)組副組長,教育部人工智能科技創(chuàng)新專家組成員,國家人工智能產(chǎn)教融合創(chuàng)新平臺負(fù)責(zé)人,認(rèn)知智能與內(nèi)容安全教育部重點(diǎn)實(shí)驗(yàn)室主任,中文信息處理黑龍江省重點(diǎn)實(shí)驗(yàn)室主任,中國計(jì)算機(jī)學(xué)會會士,中國中文信息學(xué)會副理事長,黑龍江省“人工智能”頭雁團(tuán)隊(duì)帶頭人。曾主持國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目、國家973課題、基金重點(diǎn)項(xiàng)目。獲國家科技進(jìn)步二等獎(排名第4)、黑龍江省科技進(jìn)步一等獎(排名第1)。秦兵,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、社會計(jì)算與信息檢索研究中心主任。國家重點(diǎn)研發(fā)課題、國家自然科學(xué)基金重點(diǎn)項(xiàng)目負(fù)責(zé)人?萍疾靠萍紕(chuàng)新2030—“新一代人工智能”重大項(xiàng)目管理專家組專家,中國中文信息學(xué)會常務(wù)理事、語言與知識計(jì)算專委會副主任、情感計(jì)算專委會主任,黑龍江省計(jì)算機(jī)學(xué)會自然語言處理專委會主任。主持多項(xiàng)國家及省部級項(xiàng)目,獲中文信息學(xué)會錢偉長中文信息處理科學(xué)技術(shù)獎一等獎、黑龍江省科學(xué)技術(shù)一等獎、黑龍江省科學(xué)技術(shù)二等獎。入選“2020年度人工智能全球女性及AI 2000最具影響力學(xué)者榜單”和“福布斯中國2020科技女性榜”,連續(xù)四年(2020-2023)入選愛思唯爾高被引學(xué)者榜單。
第1章 事理圖譜概述 1
1.1 事理圖譜的基本概念 1
1.1.1 事理圖譜的定義 1
1.1.2 事理圖譜中事件的定義和表示 2
1.1.3 事理圖譜中的事件關(guān)系類型 2
1.1.4 事理圖譜中的事件屬性 4
1.1.5 事理圖譜的形成過程 4
1.2 事理圖譜與知識圖譜的區(qū)別與聯(lián)系 5
1.3 事理圖譜的研究意義 7
1.4 國內(nèi)外典型的事件相關(guān)知識庫構(gòu)建項(xiàng)目 8
1.5 事理圖譜的相關(guān)技術(shù) 15
1.5.1 事理圖譜的構(gòu)建 15
1.5.2 事理圖譜的表示學(xué)習(xí) 16
1.6 事理圖譜的質(zhì)量評估 16
1.6.1 人工評估 16
1.6.2 自動評估 17
1.7 事理圖譜的應(yīng)用價(jià)值 17
1.8 本章小結(jié) 19
參考文獻(xiàn) 19
第2章 事理知識表示 21
2.1 知識表示 21
2.2 經(jīng)典知識表示方法 23
2.2.1 一階謂詞邏輯 23
2.2.2 產(chǎn)生式規(guī)則 23
2.2.3 框架表示法 23
2.2.4 腳本 24
2.3 語義網(wǎng)中的知識表示方法 25
2.3.1 XML 26
2.3.2 RDF 28
2.3.3 RDFS 28
2.3.4 OWL 29
2.4 知識圖譜的知識表示方法 31
2.4.1 知識圖譜的圖表示 31
2.4.2 知識圖譜的分布式表示 32
2.5 事理圖譜的知識表示方法 36
2.5.1 事理圖譜的圖表示 36
2.5.2 事理圖譜的分布式表示 41
2.5.3 事理圖譜中的事理知識表示方法 43
2.6 本章小結(jié) 45
參考文獻(xiàn) 46
第3章 事件抽取 48
3.1 任務(wù)概述 48
3.1.1 任務(wù)定義 48
3.1.2 公開評測和相關(guān)語料資源 50
3.1.3 評價(jià)方法 52
3.2 限定域事件抽取 53
3.2.1 基于模式匹配的方法 53
3.2.2 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法 57
3.2.3 基于深度學(xué)習(xí)的方法 61
3.3 開放域事件抽取 66
3.4 文檔級事件抽取 69
3.5 自底向上的事件抽取系統(tǒng)介紹 72
3.6 本章小結(jié) 75
參考文獻(xiàn) 75
第4章 事件模式自動歸納 79
4.1 任務(wù)概述 79
4.1.1 模板型事件模式自動歸納任務(wù)概述 80
4.1.2 敘述型事件模式自動歸納任務(wù)概述 84
4.2 事件模式自動歸納方法 87
4.2.1 模板型事件模式自動歸納方法 87
4.2.2 敘述型事件模式自動歸納方法 89
4.3 相關(guān)任務(wù) 93
4.4 本章小結(jié) 96
參考文獻(xiàn) 96
第5章 事件關(guān)系抽取 100
5.1 事件因果關(guān)系抽取 100
5.1.1 任務(wù)語料與知識庫 101
5.1.2 顯式因果關(guān)系抽取 103
5.1.3 隱式因果關(guān)系抽取 106
5.2 事件時(shí)序關(guān)系抽取 107
5.2.1 任務(wù)概述 107
5.2.2 數(shù)據(jù)集簡介 108
5.2.3 事件時(shí)序關(guān)系抽取方法 109
5.3 子事件關(guān)系抽取 113
5.3.1 任務(wù)概述 113
5.3.2 數(shù)據(jù)集簡介 114
5.3.3 子事件關(guān)系抽取方法 114
5.4 事件共指關(guān)系抽取 117
5.4.1 任務(wù)概述 117
5.4.2 數(shù)據(jù)集簡介 118
5.4.3 事件共指關(guān)系抽取方法 119
5.5 本章小結(jié) 121
參考文獻(xiàn) 121
第6章 事件表示學(xué)習(xí) 127
6.1 任務(wù)概述 127
6.1.1 任務(wù)難點(diǎn) 128
6.1.2 任務(wù)評價(jià) 129
6.2 事件的離散表示 130
6.3 結(jié)構(gòu)化事件的連續(xù)向量表示 132
6.3.1 事件元素的表示方法 133
6.3.2 組合事件元素獲取事件表示的方法 136
6.3.3 事件連續(xù)表示的學(xué)習(xí)方法 140
6.4 基于預(yù)訓(xùn)練語言模型的非結(jié)構(gòu)化事件向量表示方法 145
6.4.1 事件時(shí)間常識知識增強(qiáng)的預(yù)訓(xùn)練語言模型 146
6.4.2 動詞語用知識增強(qiáng)的預(yù)訓(xùn)練語言模型 148
6.4.3 事件演化知識增強(qiáng)的預(yù)訓(xùn)練語言模型 149
6.5 本章小結(jié) 151
參考文獻(xiàn) 151
第7章 事件泛化及事理歸納 154
7.1 任務(wù)概述 154
7.2 主要方法 155
7.2.1 基于統(tǒng)計(jì)的事件泛化方法 155
7.2.2 基于規(guī)則的事件泛化方法 162
7.2.3 基于神經(jīng)網(wǎng)絡(luò)的事件泛化方法 170
7.2.4 自然邏輯與神經(jīng)網(wǎng)絡(luò)相結(jié)合的事件泛化方法 173
7.3 本章小結(jié) 175
參考文獻(xiàn) 175
第8章 事理知識存儲和檢索 177
8.1 事理圖譜的存儲 177
8.1.1 基于表結(jié)構(gòu)的存儲 177
8.1.2 基于圖結(jié)構(gòu)的存儲 180
8.2 事理圖譜的檢索 182
8.2.1 常見的形式化檢索語言 182
8.2.2 圖檢索技術(shù) 182
8.2.3 圖數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫的特點(diǎn) 183
8.2.4 Cypher查詢語言 185
8.3 Cypher語句實(shí)踐 185
8.3.1 Neo4j的安裝與使用 186
8.3.2 節(jié)點(diǎn)的創(chuàng)建與檢索 188
8.3.3 節(jié)點(diǎn)的刪除與更新 190
8.3.4 數(shù)據(jù)導(dǎo)入與圖譜導(dǎo)出 192
8.3.5 Neo4j的高級功能 194
8.4 其他圖數(shù)據(jù)庫 194
8.5 本章小結(jié) 195
參考文獻(xiàn) 196
第9章 基于事理圖譜的認(rèn)知推理 197
9.1 認(rèn)知系統(tǒng) 198
9.2 基于知識圖譜的認(rèn)知推理 199
9.3 基于事理圖譜的認(rèn)知推理 201
9.3.1 基于事理圖譜的If-Then類型事件推理 202
9.3.2 基于事理圖譜的腳本類事件預(yù)測 204
9.3.3 基于事理圖譜的因果事件推理 208
9.4 基于事理圖譜的文本預(yù)測 215
9.5 本章小結(jié) 216
參考文獻(xiàn) 217
第10章 基于事理圖譜的應(yīng)用 219
10.1 概述 220
10.2 基于事理知識的問答 221
10.2.1 任務(wù)概述 221
10.2.2 基于事理知識的問答方法 222
10.3 基于事理知識的對話 224
10.3.1 任務(wù)概述 224
10.3.2 基于事理知識的對話方法 227
10.4 基于事理知識的消費(fèi)意圖挖掘 235
10.4.1 任務(wù)概述 235
10.4.2 基于事理知識的消費(fèi)意圖挖掘方法 236
10.5 基于事理知識的股票市場預(yù)測 239
10.5.1 任務(wù)概述 239
10.5.2 基于事理知識的股票市場預(yù)測方法 240
10.6 大語言模型背景下的事理圖譜應(yīng)用 245
10.6.1 事理圖譜如何增強(qiáng)大語言模型應(yīng)用長尾事理知識進(jìn)行推理 247
10.6.2 事理圖譜如何增強(qiáng)開源大語言模型事理推理能力 248
10.7 本章小結(jié) 249
參考文獻(xiàn) 250