余凡,講師,武漢大學(xué)質(zhì)量發(fā)展戰(zhàn)略研究院研究員,研究方向?yàn)楹暧^質(zhì)量管理、質(zhì)量大數(shù)據(jù)等。先后主持中國(guó)博士后基金項(xiàng)目、武漢大學(xué)自主科研項(xiàng)目,參與國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目、“十二五”科技支撐計(jì)劃項(xiàng)目等國(guó)家級(jí)、省部級(jí)項(xiàng)目7項(xiàng),在Electronic Library、《宏觀質(zhì)量研究》等國(guó)內(nèi)外期刊上發(fā)表學(xué)術(shù)論文16篇。
0 引言
0.1 選題背景與研究意義
O.1.1 選題背景
0.1.2 研究意義
0.2 國(guó)內(nèi)外研究綜述
0.2.1 基于不同數(shù)據(jù)源的本體半自動(dòng)構(gòu)建方法研究
0.2.2 本體概念獲取方法研究
O.2.3 本體關(guān)系獲取方法研究
O.2.4 本體形式化方法研究
0.2.5 國(guó)內(nèi)外研究述評(píng)
0.3 研究目標(biāo)與思路
0.3.1 研究目標(biāo)
0.3.2 研究思路
0.4 研究方法與工具
0.4.1 研究方法
0.4.2 研究工具
0.5 創(chuàng)新之處
1 本體相關(guān)理論研究
1.1 本體的定義
1.2 本體的類型
1.3 本體的基本元素
1.4 本體描述語(yǔ)言
1.4.1 可擴(kuò)展標(biāo)記語(yǔ)言XMI
1.4.2 資源描述框架RDF
1.4.3 網(wǎng)絡(luò)本體語(yǔ)言O(shè)WL
1.5 本體構(gòu)建方法
1.5.1 本體構(gòu)建抽象方法
1.5.2 本體構(gòu)建具體方法
1.6 本體構(gòu)建工具
1.6.1 Prot6g6
1.6.2 Jena
2 領(lǐng)域本體的概念提取方法研究
2.1 基于敘詞表的領(lǐng)域本體概念提取方法
2.1.1 敘詞表的分類及存在的問(wèn)題
2.1.2 文本存儲(chǔ)方式的轉(zhuǎn)換
2.1.3 關(guān)系二維表的數(shù)據(jù)結(jié)構(gòu)
2.1.4 敘詞表編碼映射
2.1.5 實(shí)驗(yàn)分析
2.2 基于文本的領(lǐng)域本體概念提取方法
2.2.1 領(lǐng)域本體概念提取流程
2.2.2 PDF文獻(xiàn)的下栽和轉(zhuǎn)換
2.2.3 文本切分方法
2.2.4 領(lǐng)域詞匯提取方法
2.2.5 領(lǐng)域詞匯的篩選方法
3 領(lǐng)域本體的關(guān)系提取方法研究
3.1 領(lǐng)域本體的等級(jí)關(guān)系提取方法
3.1.1 基于敘詞表的等級(jí)關(guān)系提取方法
3.1.2 基于文本的等級(jí)關(guān)系提取方法
3.2 領(lǐng)域本體的非等級(jí)關(guān)系提取方法
3.2.1 基于敘詞表的非等級(jí)關(guān)系提取方法
3.2.2 基于文本的非等級(jí)關(guān)系提取方法
4 領(lǐng)域本體形式化方法研究
4.1 本體、0WL和語(yǔ)義
4.2 形式化語(yǔ)言選擇
4.3 本體的形式化
4.3.1 本體形式化目標(biāo)
4.3.2 本體形式化方法
4.3.3 測(cè)繪學(xué)領(lǐng)域本體形式化
5 測(cè)繪學(xué)領(lǐng)域本體構(gòu)建系統(tǒng)的實(shí)現(xiàn)
5.1 領(lǐng)域本體構(gòu)建流程
5.2 需求分析
5.3 系統(tǒng)總體設(shè)計(jì)
5.4 系統(tǒng)詳細(xì)設(shè)計(jì)
5.4.1 概念提取模塊
5.4.2 概念篩選模塊
5.4.3 等級(jí)關(guān)系提取模塊
5.4.4 非等級(jí)關(guān)系提取模塊
5.4.5 領(lǐng)域本體形式化模塊
5.5 測(cè)繪學(xué)領(lǐng)域本體可視化展示
5.6 測(cè)繪學(xué)領(lǐng)域本體的應(yīng)用領(lǐng)域
5.7 領(lǐng)域本體構(gòu)建方法性能測(cè)試
6 結(jié)論與展望
6.1 結(jié)論
6.2 不足與展望
參考文獻(xiàn)
附錄:測(cè)繪學(xué)領(lǐng)域本體代碼
后記
《領(lǐng)域本體構(gòu)建方法及實(shí)證研究:以測(cè)繪學(xué)領(lǐng)域?yàn)槔罚?
(1)研究本體以及本體構(gòu)建方法的相關(guān)理論(第1章實(shí)現(xiàn))。具體研究本體在信息科學(xué)領(lǐng)域的定義是什么;本體具備哪些特征;本體有哪些不同的類型;本體由哪些基本元素組成:描述本體的語(yǔ)言包括哪幾種,它們之間存在什么聯(lián)系;本體包括哪些抽象和具體的構(gòu)建方法;本體構(gòu)建的工具有哪些。
。2)研究本體概念提取方法(第2章實(shí)現(xiàn))。具體研究如何從敘詞表和文本中提取領(lǐng)域概念:如何利用關(guān)系二維表的數(shù)據(jù)結(jié)果存儲(chǔ)敘詞表概念;如何實(shí)現(xiàn)不同編碼的敘詞表之間的映射;如何利用敘詞表組詞規(guī)則和N—gram算法提取文本概念;如何利用擴(kuò)展互信息、信息熵過(guò)濾概念;如何利用擴(kuò)展信息熵和加權(quán)算法篩選領(lǐng)域核心概念。
。3)研究本體關(guān)系提取方法(第3章實(shí)現(xiàn))。具體研究如何提取敘詞表和文本中的等級(jí)和非等級(jí)關(guān)系;如何利用基于字和詞的鄰近詞匯相似度算法形成等級(jí)關(guān)系以及兩種算法結(jié)果的比較分析;如何利用擴(kuò)展的關(guān)聯(lián)規(guī)則算法提取本體三元組中的主語(yǔ)和賓語(yǔ):如何利用規(guī)則統(tǒng)計(jì)的方法提取本體三元組中的謂語(yǔ)。
。4)研究本體形式化方法(第4章實(shí)現(xiàn))。具體研究如何選擇本體形式化語(yǔ)言;本體形式化的目標(biāo)和具體方法有哪些;如何實(shí)現(xiàn)本體的形式化處理。
。5)對(duì)本體構(gòu)建方法進(jìn)行系統(tǒng)實(shí)現(xiàn)(第5章實(shí)現(xiàn))。描述領(lǐng)域本體構(gòu)建的總體流程,并以測(cè)繪學(xué)為例,對(duì)上文研究的本體構(gòu)建方法予以系統(tǒng)實(shí)現(xiàn)。通過(guò)需求分析、總體設(shè)計(jì)和詳細(xì)設(shè)計(jì),將系統(tǒng)細(xì)分為概念提取模塊、概念篩選模塊、等級(jí)關(guān)系提取模塊、非等級(jí)關(guān)系提取模塊和形式化模塊。系統(tǒng)分別實(shí)現(xiàn)每個(gè)模塊的具體功能。
0.3.2研究思路
本書首先提出問(wèn)題,然后分析并解決問(wèn)題,最后輔以實(shí)證研究,以保證本研究的理論和實(shí)踐緊密結(jié)合。本書采用總一分一總的研究思路,在總結(jié)本體構(gòu)建理論方法的基礎(chǔ)上,分章節(jié)對(duì)本體構(gòu)建的具體步驟進(jìn)行探究,最后在實(shí)證中分別使用這些構(gòu)建方法,從而檢驗(yàn)構(gòu)建方法的適用性。具體而言,本書既分別對(duì)本體構(gòu)建步驟進(jìn)行研究分析,又對(duì)這些方法進(jìn)行比較分析。既有理論方法的研究,也有對(duì)這些方法的應(yīng)用研究。既有單個(gè)方法的研究,也有多個(gè)方法的綜合研究。既有對(duì)現(xiàn)有方法的研究,也有對(duì)現(xiàn)有方法改進(jìn)的研究。本書采用理論與實(shí)踐緊密結(jié)合的方法,針對(duì)目前構(gòu)建方法的不足,對(duì)現(xiàn)有的方法進(jìn)行適當(dāng)?shù)木C合和改進(jìn),以促進(jìn)本體構(gòu)建方法的發(fā)展,從而擴(kuò)大本體應(yīng)用的廣度和深度。
……