定 價(jià):58 元
叢書名:國家社會科學(xué)基金項(xiàng)目“圖書館資源組織語義化理論及方法研究”組織
- 作者:劉耀 著
- 出版時(shí)間:2018/2/1
- ISBN:9787518936427
- 出 版 社:科學(xué)技術(shù)文獻(xiàn)出版社
- 中圖法分類:G253.5
- 頁碼:185
- 紙張:膠版紙
- 版次:1
- 開本:16開
圖書館資源組織語義化是圖書館資源語義標(biāo)注的淺層標(biāo)注,是內(nèi)容語義化與形式語義化交互實(shí)現(xiàn)的過程。《圖書館資源組織語義化理論及方法研究》在借鑒國內(nèi)外研究成果的前提下,提出了形式語義化與內(nèi)容語義化交互的資源組織語義化理論與技術(shù)方案。在整體上以“原理方法、技術(shù)實(shí)現(xiàn)、案例應(yīng)用”為結(jié)構(gòu)體例,以“技術(shù)工具化、工具業(yè)務(wù)化、業(yè)務(wù)自動化”為目標(biāo),詳細(xì)闡述了圖書館資源組織語義化涉及的資源獲取、資源解析、數(shù)據(jù)交換、資源加工、資源結(jié)構(gòu)化、本體構(gòu)建、語義標(biāo)注等關(guān)鍵技術(shù)的原理、流程及方法,并以真實(shí)的行業(yè)領(lǐng)域應(yīng)用案例闡述了實(shí)現(xiàn)資源組織語義化的全過程,以便讀者能夠從理論和實(shí)踐兩個(gè)方面理解相關(guān)思想及方法,達(dá)到既能掌握知識又能運(yùn)用技術(shù)進(jìn)行資源組織語義化實(shí)踐的目標(biāo)。
光陰荏苒,我在中國科學(xué)技術(shù)信息研究所工作已有10年光景。2007年,我從北京大學(xué)計(jì)算語言學(xué)研究所博士后出站,之后一直從事自然語言處理、知識組織與知識工程相關(guān)的工作。多年在一線進(jìn)行研究與實(shí)踐工作,一路走來積累了豐富的經(jīng)驗(yàn),在不斷迭代和升華中,逐漸形成了一套完整的覆蓋資源獲取、資源加工到知識服務(wù)全流程的思想理論。在該理論思想的指導(dǎo)下,圍繞著技術(shù)目標(biāo),我領(lǐng)導(dǎo)團(tuán)隊(duì)逐步開展工程實(shí)踐研究,對理論方法進(jìn)行驗(yàn)證。同時(shí),根據(jù)工程實(shí)踐中的具體問題,進(jìn)行關(guān)鍵技術(shù)攻關(guān),對其中的一些流程、步驟、細(xì)節(jié)等進(jìn)行了微調(diào)和補(bǔ)充,不斷升級與完善PYROIS系統(tǒng)。PYROIS系統(tǒng)初建于2007年,2011年年初,PYROIS系統(tǒng)1.0版本上線,目前該系統(tǒng)3.0版本已研發(fā)完成。
我在很早之前就有想要寫這本書的想法,分享研究實(shí)踐中的一些想法和體會,為從事相關(guān)研究的人員提供一些思路、方法和參考,但一直沒有時(shí)間。其間,也陸陸續(xù)續(xù)地發(fā)表了一些研究論文,但沒有進(jìn)行系統(tǒng)性闡述。PYROIS系統(tǒng)3.O版上線之后,空閑時(shí)間較以前也多了些,我便抓緊時(shí)間完成了早已有的寫書的想法。
本書的主要思想是利用自然語言處理技術(shù)和機(jī)器學(xué)習(xí)方法對已有的公認(rèn)領(lǐng)域知識進(jìn)行重構(gòu)并加以利用;在構(gòu)建領(lǐng)域本體的基礎(chǔ)上,對相關(guān)文獻(xiàn)進(jìn)行語義標(biāo)注;并在大量內(nèi)容相對語義化的基礎(chǔ)上,結(jié)合傳統(tǒng)組織資源,通過機(jī)器學(xué)習(xí)等方法,生成初始語義元數(shù)據(jù);然后,在輔助平臺的幫助下,實(shí)現(xiàn)圖書館資源組織語義化過程與語義元數(shù)據(jù)體系構(gòu)建同步進(jìn)行,將語義標(biāo)注文獻(xiàn)與語義索引分別存儲,實(shí)現(xiàn)圖書館資源組織語義化。
在思想理論指導(dǎo)及技術(shù)目標(biāo)的驅(qū)動下,相關(guān)研究及實(shí)踐工作體現(xiàn)在以下幾個(gè)方面。
知識元數(shù)據(jù)庫構(gòu)建技術(shù)。從充分開發(fā)和利用百科全書資源的角度出發(fā),利用自然語言處理技術(shù)和語言分析工具分析百科全書資源,發(fā)現(xiàn)其中隱含的知識點(diǎn)及其之間的內(nèi)在關(guān)聯(lián),將大量的、不斷出現(xiàn)的知識點(diǎn)結(jié)構(gòu)化地組織和關(guān)聯(lián)起來,構(gòu)成智能連接的網(wǎng)狀圖,建立知識元數(shù)據(jù)庫。
語義元數(shù)據(jù)構(gòu)建與標(biāo)注一體化技術(shù)。將圖書館資源組織語義化看作圖書館資源語義標(biāo)注的淺層標(biāo)注,是內(nèi)容語義化與形式語義化交互實(shí)現(xiàn)的過程,基于NIP理論與方法,結(jié)合傳統(tǒng)圖書館資源組織方式與領(lǐng)域本體構(gòu)建技術(shù),搭建輔助構(gòu)建及標(biāo)注一體化平臺,實(shí)現(xiàn)語義元數(shù)據(jù)體系構(gòu)建與資源組織語義化過程同步實(shí)施。
領(lǐng)域本體自動構(gòu)建技術(shù)。通過領(lǐng)域本體構(gòu)建、語義標(biāo)注等信息技術(shù)的融合與集成,將行業(yè)領(lǐng)域知識合理分類,構(gòu)建以知識點(diǎn)為基本單元的圖書、期刊、專利數(shù)據(jù)庫,以智能檢索、知識語義導(dǎo)航、可視化等方式為科學(xué)研究、技術(shù)開發(fā)、工程設(shè)計(jì)、工程應(yīng)用的開展提供知識服務(wù),實(shí)現(xiàn)知識的共享與重用。
一體化爬蟲技術(shù)。針對語義爬蟲存在的不足,實(shí)現(xiàn)從一個(gè)概念出發(fā),自動生成語義結(jié)構(gòu),用該語義結(jié)構(gòu)指導(dǎo)爬蟲抓取數(shù)據(jù)資源;同時(shí),在爬蟲爬行過程中,不斷從數(shù)據(jù)庫中抽取相關(guān)的概念及其之間的關(guān)系,并填充進(jìn)語義結(jié)構(gòu),實(shí)現(xiàn)語義結(jié)構(gòu)進(jìn)化和爬蟲爬行迭代一體化。
劉耀,博士,中國科學(xué)技術(shù)信息研究所研究員;國家科技信息資源綜合利用與公共服務(wù)中心副主任:北京大學(xué)信息管理系管理學(xué)博士:北京大學(xué)計(jì)算語言學(xué)研究所出站博士后;中國社會科學(xué)情報(bào)學(xué)會理事會常務(wù)理事、副秘書長:中國計(jì)算機(jī)學(xué)會杰出會員:北京大學(xué)軟件與微電子學(xué)院外聘碩士研究生導(dǎo)師;主要從事自然語言處理、知識工程方向研究。先后發(fā)表學(xué)術(shù)論文80余篇,出版學(xué)術(shù)著作5部,主編、副主編教材各1部,參編著作6部;先后主持、參加完成包括國家重點(diǎn)研發(fā)計(jì)劃、國家科技支撐計(jì)劃、國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973)、國家社會科學(xué)基金在內(nèi)的科研項(xiàng)目30余項(xiàng)(主持10余項(xiàng));獲省部級獎勵5項(xiàng)、行業(yè)及協(xié)會獎5項(xiàng),申請發(fā)明專利3項(xiàng),申請軟件著作權(quán)20余項(xiàng)。
1 緒論
1.1 研究意義
1.2 研究思路
1.3 研究內(nèi)容
1.4 關(guān)鍵問題
1.5 創(chuàng)新之處
1.6 撰寫思路
1.7 本章小結(jié)
2 多資源融合
2.1 資源獲取
2.1.1 網(wǎng)絡(luò)資源獲取
2.1.2 數(shù)據(jù)庫資源獲取
2.1.3 本地資源獲取
2.2 資源解析
2.2.1 多種資源類型解析
2.2.2 多模態(tài)資源的解析
2.3 數(shù)據(jù)交換
2.3.1 數(shù)據(jù)交換技術(shù)
2.3.2 標(biāo)準(zhǔn)化體系建設(shè)
2.4 資源存儲
2.5 本章小結(jié)
3 資源加工與結(jié)構(gòu)化
3.1 占構(gòu)化語料加工
3.1.1 詞性標(biāo)注及消歧
3.1.2 詞性標(biāo)注及消歧的主要功能
3.1.3 句法自動標(biāo)注
3.1.4 語義角色自動標(biāo)注
3.1.5 文本分割
3.1.6 句間及段落關(guān)系標(biāo)注
3.2 結(jié)構(gòu)化詞表構(gòu)建
3.2.1 專業(yè)詞典構(gòu)建
3.2.2 語義詞典構(gòu)建
3.2.3 概念詞表構(gòu)建
3.2.4 同義詞表構(gòu)建
3.3 定制化處理
3.3.1 基本原理
3.3.2 模型構(gòu)建
3.3.3 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
4 本體構(gòu)建技術(shù)
4.1 相關(guān)理論
4.2 總體框架
4.2.1 基礎(chǔ)流程
4.2.2 擴(kuò)充流程
4.3 模型構(gòu)建
4.3.1 樹狀結(jié)構(gòu)到多層嵌套網(wǎng)狀結(jié)構(gòu)
4.3.2 文獻(xiàn)檢索到專家系統(tǒng)
4.3.3 自然語言描述到主題詞描述
4.4 概念獲取
4.4.1 基本思想
4.4.2 技術(shù)實(shí)現(xiàn)
4.4.3 實(shí)驗(yàn)與結(jié)果分析
4.5 屬性獲取
4.5.1 基本思想
4.5.2 技術(shù)實(shí)現(xiàn)
4.5.3 實(shí)驗(yàn)與結(jié)果分析
4.6 關(guān)系獲取
4.6.1 基本思想
4.6.2 技術(shù)實(shí)現(xiàn)
4.6.3 實(shí)驗(yàn)與結(jié)果分析
4.7 本章小結(jié)
5 語義資源生成與標(biāo)注一體化
5.1 語義資源生成
5.1.1 基于種子文件
5.1.2 基于本體結(jié)構(gòu)與語料
5.2 語義標(biāo)注
5.2.1 技術(shù)框架與思路
5.2.2 語義標(biāo)注算法
5.2.3 實(shí)驗(yàn)與結(jié)果分析
5.3 語義資源評價(jià)
5.3.1 概念覆蓋程度評價(jià)
5.3.2 屬性完整性評價(jià)
5.3.3 語義關(guān)系復(fù)雜度評價(jià)
5.4 本章小結(jié)
6 應(yīng)用案例研究
6.1 雷達(dá)語義資源生成與標(biāo)注一體化
6.1.1 目標(biāo)與要求
6.1.2 分析與構(gòu)建
6.1.3 構(gòu)建結(jié)果
6.1.4 拓展應(yīng)用
6.2 面向技術(shù)創(chuàng)新的鋁行業(yè)資源組織語義化
6.2.1 目標(biāo)與需求
6.2.2 分析與構(gòu)建
6.2.3 構(gòu)建結(jié)果
6.2.4 應(yīng)用服務(wù)
6.3 本章小結(jié)
參考文獻(xiàn)