Excel+Python 飛速搞定數(shù)據(jù)分析與處理
定 價:89.8 元
- 作者:[瑞士]費利克斯·朱姆斯坦(Felix Zumstein)
- 出版時間:2022/3/1
- ISBN:9787115586766
- 出 版 社:人民郵電出版社
- 中圖法分類:TP391.13
- 頁碼:260
- 紙張:
- 版次:01
- 開本:16開
在如今的時代,大型數(shù)據(jù)集唾手可得,含有數(shù)百萬行的數(shù)據(jù)文件并不罕見。Python是數(shù)據(jù)分析師和數(shù)據(jù)科學家的首選語言。通過本書,即使完全不了解Python,Excel用戶也能夠?qū)W會用Python將煩瑣的任務自動化,顯著地提高辦公效率,并利用Python在數(shù)據(jù)分析和科學計算方面的突出優(yōu)勢,輕松搞定Excel任務。你將學習如何用pandas替代 Excel函數(shù),以及如何用自動化Python庫替代VBA宏和用戶定義函數(shù)等。
本書既適合Excel用戶,也適合Python用戶閱讀。
●針對零編程基礎(chǔ)人士量身打造,適合辦公室人群閱讀
無須豐富的編程經(jīng)驗即可開始使用Python,借助編程的力量,輕松突破Excel的瓶頸,避免人為錯誤,將Excel和數(shù)據(jù)庫連接并獲取數(shù)據(jù),讓煩瑣的Excel任務自動化,讓您能將更多寶貴的時間花在更有價值的任務上。
●xlwings創(chuàng)始人傾力打造,手把手教學
“將Python作為Excel的腳本語言”開源Python庫xlwings的誕生很好地回答了這些問題,它讓Excel和Python珠聯(lián)璧合。而作為xlwings的創(chuàng)始人,本書作者將展示如何借用Python的力量,讓Excel快得飛起來!
●更多設(shè)備,更簡化的編程語言,一切只為更好的辦公
使用Visual Studio Code和Jupyter筆記本等便捷工具,用Python替代VBA、Power Query和Power Pivot,支持更多設(shè)備,讓您學習起來更加簡單。
費利克斯·朱姆斯坦(Felix Zumstein),流行開源Python庫xlwings的創(chuàng)始人。xlwings幫助Excel用戶利用Python腳本將任務自動化,從而實現(xiàn)效率飛躍。費利克斯在工作中接觸了大量Excel用戶,這使他對Excel在各行各業(yè)中的使用瓶頸和解決思路擁有深刻的見解。
【譯者簡介】
馮黎,Python愛好者,從事桌面應用程序、Web應用程序及游戲的開發(fā)工作,曾供職于Singtel。熱衷于研究各類編程語言,自Python 2.x時期起開始使用Python,深諳Python的語言特性。
前言 xiii
第 一部分 Python入門
第 1 章 為什么要用Python為Excel編程 3
1.1 Excel作為一門編程語言 4
1.1.1 新聞中的Excel 5
1.1.2 編程最佳實踐 5
1.1.3 現(xiàn)代Excel 10
1.2 用在Excel上的Python 11
1.2.1 可讀性和可維護性 11
1.2.2 標準庫和包管理器 12
1.2.3 科學計算 13
1.2.4 現(xiàn)代語言特性 14
1.2.5 跨平臺兼容性 15
1.3 小結(jié) 15
第 2 章 開發(fā)環(huán)境 17
2.1 Anaconda Python發(fā)行版 18
2.1.1 安裝 18
2.1.2 Anaconda Prompt 19
2.1.3 Python REPL:交互式Python會話 21
2.1.4 包管理器:Conda和pip 22
2.1.5 Conda環(huán)境 24
2.2 Jupyter筆記本 24
2.2.1 運行Jupyter筆記本 25
2.2.2 筆記本單元格 26
2.2.3 編輯模式與命令模式 28
2.2.4 執(zhí)行順序很重要 28
2.2.5 關(guān)閉Jupyter筆記本 28
2.3 VS Code 30
2.3.1 安裝和配置 31
2.3.2 執(zhí)行Python腳本 33
2.4 小結(jié) 36
第 3 章 Python入門 37
3.1 數(shù)據(jù)類型 37
3.1.1 對象 38
3.1.2 數(shù)值類型 39
3.1.3 布爾值 41
3.1.4 字符串 42
3.2 索引和切片 43
3.2.1 索引 43
3.2.2 切片 44
3.3 數(shù)據(jù)結(jié)構(gòu) 45
3.3.1 列表 45
3.3.2 字典 47
3.3.3 元組 49
3.3.4 集合 49
3.4 控制流 50
3.4.1 代碼塊和pass語句 50
3.4.2 if 語句和條件表達式 51
3.4.3 for 循環(huán)和while循環(huán) 52
3.4.4 列表、字典和集合推導式 55
3.5 組織代碼 56
3.5.1 函數(shù) 56
3.5.2 模塊和import語句 57
3.5.3 datetime類 59
3.6 PEP 8:Python風格指南 61
3.6.1 PEP 8和VS Code 62
3.6.2 類型提示 63
3.7 小結(jié) 64
第二部分 pandas入門
第4 章 NumPy基礎(chǔ) 67
4.1 NumPy入門 67
4.1.1 NumPy數(shù)組 67
4.1.2 向量化和廣播 69
4.1.3 通用函數(shù) 70
4.2 創(chuàng)建和操作數(shù)組 71
4.2.1 存取元素 71
4.2.2 方便的數(shù)組構(gòu)造器 72
4.2.3 視圖和副本 73
4.3 小結(jié) 73
第 5 章 使用pandas進行數(shù)據(jù)分析 74
5.1 DataFrame和Series 74
5.1.1 索引 76
5.1.2 列 79
5.2 數(shù)據(jù)操作 80
5.2.1 選取數(shù)據(jù) 80
5.2.2 設(shè)置數(shù)據(jù) 85
5.2.3 缺失數(shù)據(jù) 87
5.2.4 重復數(shù)據(jù) 89
5.2.5 算術(shù)運算 90
5.2.6 處理文本列 91
5.2.7 應用函數(shù) 92
5.2.8 視圖和副本 93
5.3 組合DataFrame 94
5.3.1 連接 94
5.3.2 連接和合并 95
5.4 描述性統(tǒng)計量和數(shù)據(jù)聚合 97
5.4.1 描述性統(tǒng)計量 97
5.4.2 分組 98
5.4.3 透視和熔化 99
5.5 繪圖 100
5.5.1 Matplotlib 100
5.5.2 Plotly 102
5.6 導入和導出DataFrame 104
5.6.1 導出CSV文件 105
5.6.2 導入CSV文件 106
5.7 小結(jié) 107
第6 章 使用pandas進行時序分析 109
6.1 DatetimeIndex 110
6.1.1 創(chuàng)建DatetimeIndex 110
6.1.2 篩選DatetimeIndex 112
6.1.3 處理時區(qū) 113
6.2 常見時序操作 114
6.2.1 移動和百分比變化率 114
6.2.2 基數(shù)的更改和相關(guān)性 116
6.2.3 重新采樣 118
6.2.4 滾動窗口 119
6.3 pandas的局限性 120
6.4 小結(jié) 121
第三部分 在Excel之外讀寫Excel文件
第 7 章 使用pandas操作Excel文件 125
7.1 案例研究:Excel報表 125
7.2 使用pandas讀寫Excel文件 128
7.2.1 read_excel函數(shù)和ExcelFile類 128
7.2.2 to_excel方法和ExcelWriter類 133
7.3 使用pandas處理Excel文件的局限性 134
7.4 小結(jié) 135
第 8 章 使用讀寫包操作Excel文件 136
8.1 讀寫包 136
8.1.1 何時使用何種包 137
8.1.2 excel.py模塊 138
8.1.3 OpenPyXL 139
8.1.4 XlsxWriter 143
8.1.5 pyxlsb 145
8.1.6 xlrd、xlwt和xlutils 146
8.2 讀寫包的高級主題 149
8.2.1 處理大型Excel文件 149
8.2.2 調(diào)整DataFrame在Excel中的格式 152
8.2.3 案例研究(復習):Excel報表 157
8.3 小結(jié) 158
第四部分 使用xlwings對Excel應用程序進行編程
第 9 章 Excel自動化 161
9.1 開始使用xlwings 162
9.1.1 將Excel用作數(shù)據(jù)查看器 162
9.1.2 Excel對象模型 163
9.1.3 運行VBA代碼 170
9.2 轉(zhuǎn)換器、選項和集合 170
9.2.1 處理DataFrame 171
9.2.2 轉(zhuǎn)換器和選項 172
9.2.3 圖表、圖片和已定義名稱 174
9.2.4 案例研究(再次回顧):Excel報表 177
9.3 高級xlwings主題 179
9.3.1 xlwings的基礎(chǔ) 179
9.3.2 提升性能 180
9.3.3 如何彌補缺失的功能 181
9.4 小結(jié) 182
第 10 章 Python驅(qū)動的Excel工具 183
10.1 利用xlwings將Excel用作前端 183
10.1.1 Excel插件 184
10.1.2 quickstart命令 185
10.1.3 Run main 186
10.1.4 RunPython函數(shù)187
10.2 部署 191
10.2.1 Python依賴 191
10.2.2 獨立工作簿:脫離xlwings插件 191
10.2.3 配置的層次關(guān)系 192
10.2.4 設(shè)置 193
10.3 小結(jié) 194
第 11 章 Python包追蹤器 195
11.1 構(gòu)建什么樣的應用程序 195
11.2 核心功能 197
11.2.1 Web API 198
11.2.2 數(shù)據(jù)庫 201
11.2.3 異!208
11.3 應用程序架構(gòu) 210
11.3.1 前端 211
11.3.2 后端 215
11.3.3 調(diào)試 217
11.4 小結(jié) 219
第 12 章 用戶定義函數(shù) 220
12.1 UDF入門 220
12.2 案例研究:Google Trends 225
12.2.1 Google Trends簡介 225
12.2.2 使用DataFrame和動態(tài)數(shù)組 226
12.2.3 從Google Trends上獲取數(shù)據(jù) 231
12.2.4 使用UDF繪制圖表 234
12.2.5 調(diào)試UDF 236
12.3 高級UDF主題 238
12.3.1 基礎(chǔ)性能優(yōu)化 238
12.3.2 緩存 240
12.3.3 sub裝飾器 242
12.4 小結(jié) 243
附錄A Conda環(huán)境 245
附錄B 高級VS Code功能 248
附錄C 高級Python概念 253