中文信息處理教程(普通高等教育十一五國家級規(guī)劃教材)
定 價:29 元
- 作者:宋繼華 等編著
- 出版時間:2011/6/1
- ISBN:9787040318968
- 出 版 社:高等教育出版社
- 中圖法分類:TP391.1
- 頁碼:283
- 紙張:膠版紙
- 版次:1
- 開本:16開
《中文信息處理教程》是普通高等教育“十一五”國家級規(guī)劃教材,是編者依據(jù)自身的教學實踐,在學習、吸收、借鑒前輩經驗的基礎上歸納、提煉而成的中文信息處理教材。書中比較系統(tǒng)地介紹了本學科領域的基本原理、方法和應用技術。本書共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、篇章依次展開。內容包括:導論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析與處理、中文信息處理評測。本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。《中文信息處理教程》可作為高等學校計算機、信息管理等專業(yè)本科生和研究生的教材,也可供從事中文信息處理研究和應用的科技工作者參考。本書由宋繼華等編著。
《中文信息處理教程》共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、篇章依次展開。內容包括:導論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析與處理、中文信息處理評測。本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。本書由宋繼華等編著。
第1章 導論 本章概覽 知識結構圖 1.1 基本概念 1.1.1 學科由來 1.1.2 學科定位 1.2 研究內容 1.3 難點分析 1.3.1 歧義 1.3.2 語 第1章 導論 本章概覽 知識結構圖 1.1 基本概念 1.1.1 學科由來 1.1.2 學科定位 1.2 研究內容 1.3 難點分析 1.3.1 歧義 1.3.2 語法 1.4 研究路線 1.5 習題第2章 漢字的信息處理 本章概覽 知識結構圖 2.1 基礎知識 2.1.1 漢字的形、音、義 2.1.2 漢字的字頻和字量 2.1.3 漢字的編碼 2.2 交換碼和內碼 2.2.1 ASCⅡ 2.2.2 編碼框架:ISO/IEC2022 2.2.3 GB2312 2.2.4 BIG5 2.2.5 ISO/IECl0646和Unicode 2.2.6 GBK 2.2.7 GBL8030 2.2.8 編程務實 2.3 漢字的輸入 2.3.1 鍵盤輸入 2.3.2 字形識別 2.3.3 語音識別 2.4 漢字的輸出 2.5 中文編碼的前沿課題 2.5.1 古籍數(shù)字化 2.5.2 《通用規(guī)范漢字表》 2.5.3 少數(shù)民族文字 2.6 習題第3章 詞的信息處理 本章概覽 知識結構圖 3.1 基礎知識 3.1.1 概率論基礎 3.1.2 信息論基礎 3.1.3 n元語法模型 3.1.4 語法模型的性能評價 3.2 自動分詞 3.2.1 漢語詞的界定 3.2.2 自動分詞方法 3.2.3 未登錄詞的識別 3.3 詞性標注 3.3.1 詞性標注概述 3.3.2 基于統(tǒng)計的詞性標注方法 3.3.3 基于規(guī)則的詞性標注方法 3.4 命名實體識別 3.4.1 命名實體識別介紹 3.4.2 中文命名實體的定義和標準 3.4.3 中文命名實體識別方法 3.5 習題第4章 句子的信息處理 本章概覽 知識結構圖 4.1 形式語言基礎 4.1.1 形式語言理論 4.1.2 自動機理論 4.2 短語結構語法 4.2.1 漢語短語結構語法 4.2.2 分析算法 4.2.3 實用策略 4.3 依存語法 4.3.1 依存句法理論 4.3.2 分析算法 4.4 句法理論探索 4.4.1 Chomsky語法理論 4.4.2 廣義短語結構語法 4.4.3 鏈語法 4.4.4 范疇語法 4.5 習題第5章 句子語義表達與分析 本章概覽 知識結構圖 5.1 格語法 5.1.1 基本思想 5.1.2 格的分類 5.1.3 格的判斷 5.1.4 用格語法生成句子 5.1.5 漢語格語法 5.2 概念依存理論 5.2.1 基本模型 5.2.2 語義推理 5.2.3 腳本法 5.3 概念層次網絡(HNC) 5.4 語義本體 5.5 習題第6章 中文信息處理的基礎資源 本章概覽 知識結構圖 6.1 語料庫概述 6.1.1 語料庫發(fā)展歷史 6.1.2 語料庫屬性 6.2 典型中文語科庫介紹 6.2.1 北京大學計算語言學研究所《人民日報》標注語料庫 6.2.2 清華大學漢語樹庫 6.2.3 哈爾濱工業(yè)大學漢語依存樹庫 6.2.4 中國臺灣“中央研究院”語料庫 6.2.5 國家語言文字工作委員會語料庫 6.2.6 山西大學語料庫 6.3 典型中文語言知識庫資源介紹 6.3.1 北京大學計算語言學研究所綜合型語言知識庫 6.3.2 知網 6.3.3 中國臺灣“中央研究院”中文詞匯網絡 6.3.4 概念層次網絡 6.3.5 漢語框架網知識庫 6.4 中文語言資源聯(lián)盟 6.5 習題第7章 文本分析與處理 本章概覽 知識結構圖 7.1 文本分類 7.1.1 文本表示 7.1.2 文本分類算法 7.2 信息檢索 7.2.1 常用的檢索模型 7.2.2 搜索引擎 7.3 問答系統(tǒng) 7.3.1 問答系統(tǒng)概述 7.3.2 系統(tǒng)構成 7.3.3 典型問答系統(tǒng)介紹 7.4 信息抽取 7.4.1 信息抽取概述 7.4.2 系統(tǒng)的基本構成及關鍵技術 7.5 自動文摘 7.5.1 自動文摘概述 7.5.2 基于統(tǒng)計的機械文摘 7.5.3 基于意義的理解文摘 7.6 習題第8章 中文信息處理評測 本章概覽 知識結構圖 8.1 評測概述 8.1.1 評測的意義 8.1.2 評測的過程 8.2 系列評測介紹 8.2.1 NIST系列評測 8.2.2 ACL-SIGHAN系列評測 8.2.3 863技術測評 8.2.4 中文信息學會評測 8.3 各領域技術評測介紹 8.3.1 中文分詞和詞性標注評測 8.3.2 詞義消歧評測 8.3.3 句法分析評測 8.3.4 文本分類器性能評估 8.3.5 信息檢索系統(tǒng)的評測 8.3.6 問答系統(tǒng)評測 8.3.7 信息抽取評測 8.3.8 自動文摘評測 8.4 習題 部分習題參考答案參考文獻