關于我們
書單推薦
新書推薦
|
《漢語主題詞表》構建研究 !稘h語主題詞表》是我國第一部大型綜合性敘詞表,是專家與群眾相結合,實行社會主義大協(xié)作的產(chǎn)物,是我國情報界與圖書館界于20世紀70年代協(xié)作的集體智慧結晶,并于1985年獲得國家科學技術進步獎二等獎。 隨著互聯(lián)網(wǎng)技術的高速發(fā)展,大數(shù)據(jù)、云計算、機器智能對文本數(shù)據(jù)處理提出了更豐富的應用需求,對知識組織提出了更細粒度的計算關聯(lián)要求,如進行切詞、信息抽取、聚類、詞頻統(tǒng)計、情感分析等文本信息處理,在電子政務、電子商務的信息搜索中實現(xiàn)知識自動分類、智能推理和語義聚類,在各類知識管理中實現(xiàn)不同粒度的智能查詢、領域監(jiān)測、知識挖掘,在信息檢索發(fā)現(xiàn)中實現(xiàn)分類導航和語義分面、英漢跨語言檢索和輔助機器翻譯等功能。這些都需要借助主題詞表進行知識組織和文本處理,即《漢語主題詞表》的應用將超越傳統(tǒng)主題標引,跨出傳統(tǒng)圖書情報檔案領域,融入整個文本信息處理和知識組織過程之中,應用于情報檢索、搜索引擎、知識管理、電子政務、電子商務、數(shù)字出版、數(shù)據(jù)挖掘、知識計算等領域,發(fā)揮其更加廣泛、更深層次和更有價值的作用,這就需要跨出圖書情報視野,借助大數(shù)據(jù)、云計算和機器智能等新動能,放眼整個知識內容行業(yè)和文本信息處理領域,不斷完善《漢語主題詞表》的內在結構和外在功能,為《漢語主題詞表》注入新鮮血液和活力,煥發(fā)數(shù)字環(huán)境下《漢語主題詞表》的生命力。為此,中國科學技術信息研究所于2009年啟動《漢語主題詞表》在網(wǎng)絡環(huán)境下的重構與修訂工作,并分工程技術卷、自然科學卷、生物醫(yī)學農(nóng)業(yè)卷和社會科學卷依次展開修訂。 為此,我們在中國科學技術信息研究所信息資源中心(國家工程技術圖書館)成立了《漢語主題詞表》研究編制專項組。我們在剖析和正視傳統(tǒng)《漢語主題詞表》的內在問題和外在機遇之后,通過分析新時期知識組織和文本處理對《漢語主題詞表》的需求,制定新型《漢語主題詞表》編制的技術路線,編制新型《漢語主題詞表》的重構和修訂方案,收集與加工了包括文獻關鍵詞、用戶檢索詞、各類百科全書、專業(yè)術語、相關專業(yè)及綜合敘詞表等在內的術語資源,建立收詞量達400萬條的基礎詞庫;研究詞匯概念的分類方法,構建概念與文獻導航的范疇體系;結合認知計算和機器智能應用需要,制定《漢語主題詞表》編制標準和規(guī)則,開發(fā)基于標準規(guī)則的敘詞表協(xié)同編制管理平臺;建立專業(yè)術語選詞、專業(yè)概念歸類與同義詞歸并、關系建立、范疇劃分、邏輯關系驗證、英文審定、增加參考注釋等工作流程;采取先選詞再分編最后融合、先選詞再集成最后集中編制等多種方式,展開不同領域主題詞表的編制工作。目前,《漢語主題詞表(工程技術卷)》《漢語主題詞表(自然科學卷)》已經(jīng)修訂完成并出版,正聯(lián)合相關單位編制《漢語主題詞表(生物醫(yī)學農(nóng)業(yè)卷)》。 網(wǎng)絡環(huán)境下《漢語主題詞表》的重構與修訂是新時期全國圖書情報界再次集體協(xié)作的典范項目,是網(wǎng)絡在線編制敘詞表的協(xié)同示范!稘h語主題詞表》建設和應用具有深厚的理論基礎,網(wǎng)絡環(huán)境下《漢語主題詞表》既可以運用于知識組織與知識關聯(lián),又可以支撐知識計算與知識服務,通過有機地嵌入各類信息系統(tǒng),實現(xiàn)基于《漢語主題詞表》的機器標注和語義關聯(lián),直接應用到主題標引、知識檢索、自動聚類、熱點追蹤、知識鏈接、術語服務、科研關系網(wǎng)絡構建等多個方面。我們一方面期待與業(yè)界同行繼續(xù)推進《漢語主題詞表》的基礎建設和持續(xù)維護更新;另一方面期盼社會各界全面實施網(wǎng)絡環(huán)境下《漢語主題詞表》的應用及實踐,不斷推進知識資源的有序組織和知識服務的深層次發(fā)展,服務于信息精確檢索和數(shù)據(jù)智能挖掘。
你還可能感興趣
我要評論
|