人人干人人摸人人,伊在人亚洲香蕉精品区

本書在全面介紹文本信息抽取技術(shù)在古籍文本處理方面應(yīng)用的基礎(chǔ)上，著重介紹文本信息抽取與知識挖掘的基本概念、原理和方法，包括文本預(yù)處理、特征提取、命名實體識別、信息抽取、語義分析、知識表示等關(guān)鍵技術(shù)。

全書共3部分：第1部分(第1、2章)著重介紹古籍文本信息抽取的相關(guān)背景知識；第2部分(第3~8章)著重討論命名實體識別、關(guān)系抽取和事件抽取的具體方法，同時介紹對應(yīng)的實驗應(yīng)用及結(jié)果分析；第3部分(第9章)基于對當(dāng)前實體抽取領(lǐng)域研究現(xiàn)狀的分析與總結(jié)，展望未來。同時，全書也提供了大量應(yīng)用實例。

本書適合作為高等院校計算機(jī)、軟件工程及相關(guān)專業(yè)本科生、研究生的參考書，也可供對自然語言處理比較熟悉并且對信息抽取有所了解的開發(fā)人員、廣大科技工作者和研究人員學(xué)習(xí)使用。

古籍文本信息抽取與挖掘的重要性在于保護(hù)和傳承人類的文化遺產(chǎn)，以及促進(jìn)學(xué)術(shù)研究和歷史探索。古籍文本是記錄了古代知識、思想、文化和歷史的寶貴資源。通過對古籍文本進(jìn)行信息抽取，可以從大量的文字資料中提取出有用的信息，為人們的研究和了解相關(guān)題材提供重要的線索和指引。

本書全面介紹文本信息抽取與知識挖掘的基本概念、原理和方法，包括文本預(yù)處理、特征提取、命名實體識別(NER)、信息抽取、語義分析、知識表示等關(guān)鍵技術(shù)。讀者可了解每種實施方法及其執(zhí)行流程。

本書中提供一系列實用的方法和工具，指導(dǎo)讀者在實際應(yīng)用中進(jìn)行文本信息抽取和知識挖掘。這些方法和工具包括基于規(guī)則的抽取、統(tǒng)計方法、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)等。讀者可以通過實例和案例學(xué)習(xí)如何選擇適當(dāng)?shù)姆椒ê凸ぞ�，并將其�?yīng)用于自己的項目實踐中。

本書以文本信息抽取的基礎(chǔ)知識為基點，通過理論與實踐相結(jié)合，重點介紹實體抽取與關(guān)系抽取(RE)的技術(shù)方法，及其在中國少數(shù)民族古籍總目提要數(shù)據(jù)集上的實際應(yīng)用；針對NER，介紹基于Transformer模型的方法和基于提示學(xué)習(xí)的方法；針對RE，介紹基于遠(yuǎn)程監(jiān)督的方法和基于遷移學(xué)習(xí)的方法；針對事件抽取(EE)，介紹聯(lián)合模型的EE和篇章級的EE。

全書共9章。第1章為緒論，介紹古籍文本信息抽取的研究背景與意義，以及信息抽取的相關(guān)定義和基本方法。第2章詳細(xì)介紹信息抽取的概念和基礎(chǔ)理論，并淺析古籍文本信息抽取的應(yīng)用領(lǐng)域。第3、4章介紹NER的核心方法，分別是基于Transformer模型的方法和基于提示學(xué)習(xí)的方法。第5、6章介紹實體RE的核心方法，分別是基于遠(yuǎn)程監(jiān)督的方法和基于遷移學(xué)習(xí)的方法。第7、8章介紹EE的核心方法，分別是聯(lián)合模型的EE和篇章級的EE方法。在第3~8章中，每一個方法都提供了相應(yīng)的實驗及對實驗結(jié)果的分析。第9章為總結(jié)與展望，主要內(nèi)容是對當(dāng)前在實體RE領(lǐng)域相關(guān)技術(shù)的總結(jié)及對于此領(lǐng)域內(nèi)技術(shù)未來發(fā)展方向的展望。

本書可以作為計算機(jī)、軟件工程及相關(guān)專業(yè)學(xué)生實體抽取文本信息抽取信息挖掘等課程的參考書，同時也可作為計算機(jī)從業(yè)人員實體RE、EE、文本信息挖掘相關(guān)知識的入門學(xué)習(xí)資料。讀者最好在學(xué)習(xí)過人工智能機(jī)器學(xué)習(xí)深度學(xué)習(xí)等相關(guān)課程后再學(xué)習(xí)本書及自然語言處理的相應(yīng)課程。

本書在編寫過程中得到中央民族大學(xué)信息工程學(xué)院的研究生穆日亙、毛寧靜、丁福森、李蕊、王文涵、張小苗、儀超、金明哲的大力支持，在此表示衷心的感謝。同時，還需感謝本書后參考文獻(xiàn)的作者，感謝他們的資料對本書的指導(dǎo)。感謝清華大學(xué)出版社編輯們對本書的出版給予的寶貴建議。

在本書的撰寫和相關(guān)技術(shù)的研究中，由于編者受知識水平所限及時間倉促，書中錯誤與疏漏之處在所難免，敬請廣大讀者批評指正。

盧勇
2024年8月

你還可能感興趣

我要評論