定 價(jià):39 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:李文平
- 出版時(shí)間:2021/2/1
- ISBN:9787111672371
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:156
- 紙張:
- 版次:1
- 開本:16K
本書是一本為人文社會科學(xué)方向的老師和學(xué)生量身打造的Python入門書。大數(shù)據(jù)時(shí)代人文社會科學(xué)的研究者應(yīng)該充分利用數(shù)據(jù)資源,分析數(shù)據(jù)背后隱藏的一般規(guī)律和特征。
本書以解決語言研究中常見的問題為主線,涉及中、英、日三種語言。以具體的問題為導(dǎo)向,講解快速、高效處理這些問題的方法,對每種方法都配有全部代碼及其詳細(xì)說明。將這些代碼與第10章的批處理方法相結(jié)合,可以大大提高工作效率及準(zhǔn)確性。本書每章都配有習(xí)題,便于加深理解和應(yīng)用拓展。
本書適合作為自學(xué)Python的參考書,亦可作為語料庫語言學(xué)、計(jì)量語言學(xué)、計(jì)量風(fēng)格學(xué)等課程的教材。
目 錄
前 言
第1篇 準(zhǔn)備工作與文本
第1章 語言研究與編程3
1.1 學(xué)習(xí)編程的理由3
1.1.1 大數(shù)據(jù)語言研究3
1.1.2 新增功能4
1.1.3 注意事項(xiàng)5
1.2 編程難點(diǎn)6
1.3 本書構(gòu)成6
1.3.1 內(nèi)容構(gòu)成6
1.3.2 樣本文件和相關(guān)軟件6
1.4 本章小結(jié)6
習(xí)題6
第2章 文本數(shù)據(jù)7
2.1 文本文件的優(yōu)點(diǎn)7
2.2 文本文件的使用8
2.2.1 文本編輯器8
2.2.2 文本編輯器的安裝8
2.2.3 單文本檢索9
2.2.4 多文本檢索11
2.2.5 文本編輯器替換實(shí)例12
2.3 字符編碼與換行編碼13
2.3.1 字符編碼13
2.3.2 字符編碼的判斷13
2.3.3 字符編碼的轉(zhuǎn)換15
2.3.4 換行編碼15
2.4 本章小結(jié)16
習(xí)題16
第3章 正則表達(dá)式17
3.1 正則表達(dá)式的定義17
3.2 文本查找17
3.2.1 符號“?”的用法18
3.2.2 符號“.”的用法18
3.2.3 符號“+”的用法20
3.2.4 符號“*”的用法20
3.2.5 符號“[ ]”的用法20
3.2.6 符號“|”的用法22
3.2.7 符號“^”與“$”的用法23
3.2.8 后方引用23
3.2.9 元字符組合24
3.3 文本替換25
3.4 本章小結(jié)28
習(xí)題28
第2篇 Python的基礎(chǔ)知識
第4章 Python入門31
4.1 選擇Python的理由31
4.2 Python的安裝31
4.3 Python的運(yùn)行33
4.4 Python的計(jì)算34
4.4.1 Python的計(jì)算器功能34
4.4.2 變量34
4.5 字符串35
4.5.1 字符串顯示36
4.5.2 字符串長度:len( )函數(shù)37
4.5.3 數(shù)值與字符串37
4.5.4 數(shù)值轉(zhuǎn)字符串:str( )函數(shù)38
4.5.5 字符串轉(zhuǎn)數(shù)值:int( )函數(shù)38
4.6 本章小結(jié)39
習(xí)題39
第5章 使用Python讀取文件40
5.1 保存并運(yùn)行Python程序40
5.1.1 程序編寫41
5.1.2 準(zhǔn)備工作41
5.1.3 程序運(yùn)行43
5.1.4 錯(cuò)誤處理43
5.2 添加注釋45
5.3 結(jié)果保存46
5.4 程序分析46
5.5 本章小結(jié)47
習(xí)題48
第6章 Python的檢索49
6.1 if語句49
6.2 字符串語句51
6.2.1 運(yùn)算符in51
6.2.2 startswith( )函數(shù)與endswith( )
函數(shù)51
6.3 not,and,or52
6.3.1 否定:not52
6.3.2 與關(guān)系:and52
6.3.3 或關(guān)系:or53
6.4 else與elif53
6.5 if實(shí)例54
6.5.1 特定行輸出54
6.5.2 字母大小寫55
6.5.3 刪除空行56
6.6 本章小結(jié)56
習(xí)題56
第7章 for循環(huán)58
7.1 循環(huán)的基礎(chǔ)知識58
7.2 循環(huán)控制語句60
7.2.1 跳過當(dāng)前循環(huán):continue60
7.2.2 循環(huán)中止:break61
7.3 循環(huán)應(yīng)用62
7.3.1 添加行號62
7.3.2 部分文件的輸出63
7.3.3 關(guān)鍵詞標(biāo)記64
7.3.4 空標(biāo)記65
7.4 本章小結(jié)66
習(xí)題66
第8章 單詞一覽表:列表68
8.1 列表68
8.1.1 列表的索引與切片69
8.1.2 列表元素的添加70
8.1.3 列表排序71
8.2 列表與循環(huán)72
8.3 文件排序73
8.4 單詞一覽表74
8.4.1 字符串與列表轉(zhuǎn)換:split( )和
join( )74
8.4.2 單詞一覽表程序75
8.4.3 符號處理77
8.5 表格數(shù)據(jù)處理77
8.6 本章小結(jié)80
習(xí)題80
第9章 單詞頻度表:字典81
9.1 字典的基礎(chǔ)知識81
9.2 單詞頻度表83
9.3 頻度表排序85
9.4 字典的導(dǎo)入86
9.5 本章小結(jié)88
習(xí)題88
第10章 文件操作89
10.1 文件的輸入與輸出89
10.1.1 操作對象89
10.1.2 文件的輸出91
10.1.3 關(guān)鍵詞91
10.2 批處理92
10.2.1 文件一覽表92
10.2.2 文件內(nèi)容的輸出93
10.2.3 文件名的輸出94
10.2.4 文件檢索95
10.2.5 文件替換95
10.3 本章小結(jié)97
習(xí)題97
第11章 Python中的正則
表達(dá)式98
11.1 正則表達(dá)式檢索98
11.1.1 匹配99
11.1.2 匹配行輸出99
11.1.3 匹配單詞統(tǒng)計(jì)100
11.1.4 匹配單詞列表102
11.2 替換102
11.3 本章小結(jié)103
習(xí)題103
第3篇 Python應(yīng)用:以漢語文本為中心
第12章 漢語詞性標(biāo)注基礎(chǔ)及
常用工具107
12.1 漢語詞性標(biāo)注107
12.2 漢語詞性標(biāo)注工具108
12.2.1 NLPIR108
12.2.2 Python jieba110
12.3 本章小結(jié)112
習(xí)題112
第13章 日語形態(tài)素解析工具113
13.1 形態(tài)素解析113
13.2 形態(tài)素解析工具簡介114
13.2.1 軟件下載114
13.2.2 軟件安裝115
13.3 形態(tài)素解析工具的使用方法118
13.3.1 數(shù)據(jù)的選擇119
13.3.2 輸出選項(xiàng)120
13.4 形態(tài)素解析的注意事項(xiàng)123
13.4.1 解析精度123
13.4.2 解析單位124
13.5 本章小結(jié)125
習(xí)題126
第14章 Python處理漢語文本127
14.1 文本的讀寫127
14.2 漢語單詞頻度表128
14.3 動詞頻度表132
14.4 本章小結(jié)134
習(xí)題134
第15章 KWIC檢索135
15.1 KWIC135
15.2 KWIC檢索程序136
15.2.1 讀入數(shù)據(jù)136
15.2.2 range( )函數(shù)138
15.2.3 前后語境140
15.2.4 KWIC檢索程序代碼141
15.3 本章小結(jié)143
習(xí)題143
第16章 詞語搭配檢索144
16.1 詞語搭配檢索程序144
16.2 程序的改進(jìn)147
16.2.1 批處理148
16.2.2 復(fù)雜匹配150
16.3 程序的拓展154
16.3.1 語境范圍154
16.3.2 檢索條件155
16.4 本章小結(jié)155
習(xí)題155
參考文獻(xiàn)156