信息技術(shù)在網(wǎng)絡(luò)技術(shù)和人工智能技術(shù)發(fā)展的推動下,其發(fā)展的勢頭日益迅猛,體現(xiàn)在信息檢索技術(shù)上就是搜索引擎的普及速度和技術(shù)深入的速度大大超出了人們的想象。
目前,計算機信息檢索技術(shù)的發(fā)展方向有三個:一是傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索發(fā)展,在深度上提高信息組織、信息管理的能力,如探索自動抽詞、自動索引、自動檢索、自動文摘等;二是信息資源網(wǎng)絡(luò)化和分布化,需要進一步探索搜索引擎的搜索原理和搜索技術(shù);三是隨著人工智能與信息檢索結(jié)合,智能檢索技術(shù)開始嶄露頭角,其應(yīng)用如產(chǎn)品推薦、信息流推薦和音樂推薦等,未來將大有可為。利用搜索引擎來獲取信息已經(jīng)成為人們的。所以,了解和理解搜索引擎的搜索機制、運行原理和搜索方式就成為本專業(yè)領(lǐng)域越來越重要的內(nèi)容。有鑒于此,在第二版的基礎(chǔ)上,本書重點突出了搜索引擎的基本概念、相關(guān)技術(shù)的理解和運用。在介紹通用搜索引擎的基礎(chǔ)上,引入垂直搜索、站內(nèi)搜索、知識搜索和智能搜索的基本知識,將搜索領(lǐng)域研究的內(nèi)容引入計算機信息檢索教學(xué)中。
對于當(dāng)代人來說,學(xué)會如何獲取新知識比牢記許多知識更為重要。這是因為,在知識經(jīng)濟時代,知識的總量在迅速膨脹,人的記憶力十分有限;知識的更新越來越快,要把主要的注意力放在獲取新知識的能力上;如何在茫茫信息海洋中掌握去偽存真、棄粗存精的方法,及時并有效地獲取有用信息已成為必須掌握的生存技能。
信息素質(zhì)教育是大學(xué)教育發(fā)展的另一個重要趨勢,這種教育并不是單一的信息獲取能力的培養(yǎng),而是認識和培養(yǎng)從各種信息源中提取、評價和使用信息的能力,其具體內(nèi)涵包括了解信息需求及問題所在、制定信息檢索策略、掌握信息檢索技術(shù)、能評價信息并根據(jù)實際用途組織信息、使用信息,將新信息融匯到現(xiàn)有的知識結(jié)構(gòu)中。
為此,本書在前導(dǎo)課程計算機應(yīng)用技術(shù)的基礎(chǔ)上,引進數(shù)據(jù)庫技術(shù)、通信技術(shù)和網(wǎng)絡(luò)技術(shù)內(nèi)容,重點介紹國內(nèi)外檢索數(shù)據(jù)庫的使用,使學(xué)生掌握搜集、分析信息所需要的技能。更具體的教學(xué)目標(biāo)是按國外同類課程的標(biāo)準(zhǔn)培養(yǎng)學(xué)生的五種信息技能:明確檢索課題,確定所需信息;善于分析和尋找各類信息源,檢索到符合課題的信息;理解信息并加以利用;具有信息綜合和組織能力;具有信息評估能力。
本書由盛宇任主編,林凌、張忠敏、韓冰任副主編,編寫其間得到了李慧瑜、王克萍等的參與和協(xié)助。本書章節(jié)分配如下:盛宇負責(zé)第1、2章、第5~9章的撰寫;林凌負責(zé)第3章的撰寫;韓冰負責(zé)第4、11章的撰寫;張忠敏負責(zé)第10章的撰寫;李慧瑜、王克萍參與第3、6、7、9、11章的修訂和校對。
限于編者的學(xué)識和水平以及成書與信息檢索技術(shù)發(fā)展的相對滯后性,書中疏漏與不妥之處在所難免,敬請讀者不吝賜教。
編 者
2020年10月
第1章 計算機信息檢索基礎(chǔ) 1
1.1 學(xué)科基礎(chǔ)信息學(xué) 1
1.1.1 信息概述 1
1.1.2 信息需要和檢索 5
1.2 技術(shù)基礎(chǔ)信息技術(shù) 11
1.2.1 信息技術(shù)概述 11
1.2.2 信息檢索的關(guān)鍵技術(shù)數(shù)據(jù)庫技術(shù) 13
1.2.3 網(wǎng)絡(luò)時代對信息存儲與檢索技術(shù)的挑戰(zhàn) 16
第2章 計算機信息檢索概述 20
2.1 計算機信息檢索的基本概念 20
2.1.1 計算機信息檢索的發(fā)展、條件和類型 20
2.1.2 計算機信息檢索的原理 22
2.1.3 計算機信息檢索系統(tǒng) 24
2.2 計算機信息檢索語言 28
2.2.1 檢索語言基礎(chǔ)知識 29
2.2.2 檢索語言的類型 31
2.3 計算機信息檢索原理、步驟和檢索效果 35
2.3.1 計算機信息檢索的步驟 35
2.3.2 檢索效果的評價指標(biāo) 38
2.3.3 檢索策略 41
第3章 計算機信息檢索技術(shù)實現(xiàn) 44
3.1 初級和高級檢索技術(shù) 44
3.1.1 初級檢索技術(shù) 44
3.1.2 高級檢索技術(shù) 47
3.1.3 智能檢索技術(shù) 48
3.1.4 自然語言處理技術(shù) 50
3.2 信息檢索技術(shù)的延伸數(shù)據(jù)挖掘 52
3.2.1 數(shù)據(jù)挖掘基本概況 53
3.2.2 數(shù)據(jù)挖掘常用的技術(shù) 55
3.2.3 信息檢索和數(shù)據(jù)挖掘的技術(shù)關(guān)聯(lián)分析 56
第4章 網(wǎng)絡(luò)信息資源概述 60
4.1 網(wǎng)絡(luò)資源的基本概念 60
4.1.1 Internet概況 60
4.1.2 網(wǎng)絡(luò)信息資源的類型 62
4.2 網(wǎng)絡(luò)信息資源的組織 68
4.2.1 元數(shù)據(jù)概述 68
4.2.2 元數(shù)據(jù)的主要代表:Dublin Core 69
第5章 網(wǎng)絡(luò)信息資源檢索搜索引擎(1) 72
5.1 搜索引擎 72
5.1.1 搜索引擎概述 72
5.1.2 搜索引擎技術(shù)分析 75
5.1.3 搜索引擎評價 81
5.2 著名搜索引擎Google(谷歌) 82
5.2.1 關(guān)于Google 82
5.2.2 PageRank算法解析 88
5.3 著名搜索引擎Baidu(百度) 90
5.3.1 關(guān)于Baidu 90
5.3.2 Baidu的超鏈分析 91
5.3.3 Baidu和Google主要內(nèi)容比較分析 93
5.4 搜索引擎的搜索策略和技巧 95
5.4.1 利用搜索引擎學(xué)習(xí)網(wǎng)站 96
5.4.2 搜索引擎的搜索步驟 97
5.4.3 搜索引擎的搜索技巧 98
5.4.4 常見問題的搜索方法 103
5.4.5 搜索引擎的優(yōu)化(SEO) 106
第6章 網(wǎng)絡(luò)信息資源檢索搜索引擎(2) 111
6.1 國外常用的搜索引擎介紹 111
6.2 元搜索引擎 116
6.2.1 元搜索引擎概述 116
6.2.2 元搜索引擎的優(yōu)勢、選擇和評價 119
6.2.3 常用元搜索引擎介紹 120
6.3 垂直搜索引擎 122
6.3.1 垂直搜索引擎概述 122
6.3.2 垂直搜索引擎的技術(shù)分析 124
6.3.3 垂直搜索引擎的現(xiàn)狀分析 127
6.4 站內(nèi)搜索引擎 130
6.4.1 站內(nèi)搜索引擎概述 130
6.4.2 典型站內(nèi)搜索引擎介紹 131
6.4.3 垂直和通用搜索引擎的差別 131
6.5 知識搜索 133
第7章 網(wǎng)絡(luò)信息資源檢索綜合和專題數(shù)據(jù)庫 136
7.1 綜合數(shù)據(jù)庫檢索系統(tǒng) 136
7.1.1 中國期刊網(wǎng)概況 136
7.1.2 維普資訊數(shù)據(jù)庫 138
7.1.3 中國高等教育文獻保障系統(tǒng) 138
7.1.4 萬方數(shù)據(jù)資源檢索系統(tǒng) 138
7.1.5 中文社科報刊篇名數(shù)據(jù)庫 139
7.1.6 SCI Expanded 139
7.1.7 聯(lián)機公共目錄檢索系統(tǒng) 140
7.2 專題數(shù)據(jù)庫檢索系統(tǒng) 141
7.2.1 網(wǎng)上專利信息檢索 141
7.2.2 網(wǎng)上學(xué)位論文信息檢索 144
7.2.3 網(wǎng)上學(xué)術(shù)會議信息檢索 146
7.2.4 網(wǎng)上科技報告信息檢索 147
7.2.5 網(wǎng)上標(biāo)準(zhǔn)資料信息檢索 148
7.2.6 網(wǎng)上參考工具書信息檢索 149
7.2.7 Google Earth檢索 151
第8章 網(wǎng)絡(luò)信息資源檢索國際聯(lián)機檢索 154
8.1 聯(lián)機檢索系統(tǒng) 154
8.1.1 聯(lián)機檢索系統(tǒng)概述 154
8.1.2 聯(lián)機檢索系統(tǒng)的選擇及數(shù)據(jù)庫選擇 155
8.2 國際聯(lián)機檢索:Dialog 157
8.2.1 Dialog概述 157
8.2.2 Dialog檢索技術(shù) 159
8.2.3 Dialog檢索步驟、結(jié)果處理及操作實例 162
8.3 國際聯(lián)機檢索:OCLC的First Search 163
8.3.1 FirstSearch概述 163
8.3.2 FirstSearch數(shù)據(jù)庫 164
8.3.3 FirstSearch檢索方法 166
第9章 多媒體信息檢索 170
9.1 多媒體信息檢索概述及關(guān)鍵技術(shù) 170
9.1.1 多媒體信息檢索概述 170
9.1.2 多媒體信息檢索的關(guān)鍵技術(shù) 171
9.2 多媒體信息檢索圖像檢索 173
9.2.1 圖像數(shù)據(jù)的檢索原理、方法與技術(shù) 173
9.2.2 基于圖像內(nèi)容的圖像檢索系統(tǒng) 176
9.3 多媒體信息檢索視頻檢索 183
9.3.1 視頻檢索概述 183
9.3.2 視頻檢索關(guān)鍵技術(shù) 186
9.4 多媒體信息檢索音頻檢索 189
9.4.1 音頻檢索概述 189
9.4.2 音頻檢索方法 191
第10章 學(xué)術(shù)論文撰寫、答辯及發(fā)表 193
10.1 學(xué)術(shù)論文 193
10.1.1 學(xué)術(shù)論文概述 193
10.1.2 學(xué)術(shù)論文的選題 194
10.2 學(xué)術(shù)論文的撰寫 198
10.2.1 學(xué)術(shù)論文撰寫的過程 198
10.2.2 學(xué)術(shù)論文的具體要求 205
10.3 學(xué)術(shù)論文的使用 207
10.3.1 學(xué)術(shù)論文的講解、答辯和發(fā)表 207
10.3.2 利用信息資源進行論文寫作的示例 208
第11章 國內(nèi)主要數(shù)據(jù)庫檢索方法匯集 209
11.1 中國期刊網(wǎng)檢索方法 209
11.2 中文科技期刊數(shù)據(jù)庫檢索方法 217
11.3 萬方數(shù)據(jù)資源檢索系統(tǒng)檢索方法 223