智能分析:ChatGPT+Excel+Python超強組合玩轉數(shù)據(jù)分析
定 價:89 元
- 作者:童大謙
- 出版時間:2023/12/1
- ISBN:9787121466205
- 出 版 社:電子工業(yè)出版社
寫作本書的目的是希望讓不懂編程的讀者也能使用ChatGPT生成代碼,輕松實現(xiàn)Excel數(shù)據(jù)處理自動化,讓讀者從零基礎成為高手;讓懂編程的讀者也能收獲良多,快速提升工作效率。書中用ChatGPT自動生成代碼,實現(xiàn)了Excel數(shù)據(jù)處理自動化的絕大部分內容,包括數(shù)據(jù)導入和導出、數(shù)據(jù)整理、數(shù)據(jù)預處理、數(shù)據(jù)統(tǒng)計分析、數(shù)據(jù)可視化和與Excel工作表交互等。書中針對數(shù)據(jù)處理的每個問題都提供了示例,結合示例實踐了提示詞的編寫技巧,并對與表達、數(shù)據(jù)、輸出、效率和語言等相關的主題進行了探討和總結。書中的代碼是使用pandas、xlwings和OpenPyXL編寫的,這也是目前通過編程方式處理Excel數(shù)據(jù)最優(yōu)的工具組合。本書適合任何對ChatGPT和Excel數(shù)據(jù)處理感興趣的讀者閱讀,包括職場辦公人員、數(shù)據(jù)分析人員、大學生、科研人員和程序員等。
童大謙,具有15年以上VB、VBA、.NET開發(fā)經(jīng)驗,開發(fā)了多個數(shù)學、數(shù)據(jù)分析與可視化方面的軟件,以及與科研院所合作開發(fā)了若干個軟件系統(tǒng)。對Python、MATLAB、SPSS、R等數(shù)據(jù)分析軟件非常熟悉,出版多本相關圖書。曾在高校執(zhí)教,CSDN高級講師,全網(wǎng)學員目前近30萬人。
第1章 概述1
1.1 Excel和Python數(shù)據(jù)處理簡介1
1.1.1 Excel數(shù)據(jù)處理1
1.1.2 使用Python處理數(shù)據(jù)2
1.1.3 pandas、xlwings和OpenPyXL組合的優(yōu)勢2
1.1.4 DataFrame和Series3
1.1.5 Python及各種包的安裝4
1.1.6 Python IDLE編程環(huán)境5
1.2 ChatGPT及其操作基礎7
1.2.1 ChatGPT簡介7
1.2.2 得到想要的答案:提示詞簡介7
1.2.3 使用ChatGPT生成代碼9
1.2.4 面向問題重構與提示詞模板11
1.2.5 使用ChatGPT進行數(shù)據(jù)分析的主要思想和步驟小結11
1.3 提示詞的編寫技巧12
1.3.1 基本技巧12
1.3.2 數(shù)據(jù)相關12
1.3.3 表達相關13
1.3.4 輸出相關14
1.3.5 效率相關14
1.3.6 語言相關15
1.4 怎樣使用本書16
1.4.1 不同讀者怎樣使用本書16
1.4.2 在使用提示詞時可能遇到的問題及解決辦法16
第2章 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)導入和導出18
2.1 使用ChatGPT+pandas導入Excel文件中的數(shù)據(jù)18
2.1.1 導入Excel文件中的全部數(shù)據(jù)18
2.1.2 導入Excel文件中的部分數(shù)據(jù)20
2.2 使用ChatGPT+pandas將數(shù)據(jù)寫入Excel文件中21
2.3 使用ChatGPT+pandas實現(xiàn)CSV文件中數(shù)據(jù)的導入和導出23
2.4 將數(shù)據(jù)保存到新工作簿的工作表中25
2.5 將數(shù)據(jù)保存到同一工作簿的新工作表中27
2.6 局部區(qū)域數(shù)據(jù)的導入和導出(與xlwings交互)31
2.7 局部區(qū)域數(shù)據(jù)的導入和導出(與OpenPyXL交互)33
第3章 使用ChatGPT+pandas實現(xiàn)單個文件數(shù)據(jù)的整理36
3.1 使用ChatGPT+pandas實現(xiàn)列操作36
3.1.1 直接添加一個新列36
3.1.2 利用已有列數(shù)據(jù)通過簡單計算得到新列38
3.1.3 利用已有列數(shù)據(jù)通過轉換得到新列39
3.1.4 利用已有列數(shù)據(jù)通過統(tǒng)計得到新列42
3.1.5 根據(jù)簡單條件得到新列45
3.1.6 根據(jù)多級條件得到新列46
3.1.7 根據(jù)多列數(shù)據(jù)組成的條件得到新列48
3.1.8 根據(jù)條件得到新列(mask方法)50
3.1.9 根據(jù)條件得到新列(where方法)51
3.1.10 插入列53
3.1.11 修改單個列的列名54
3.1.12 修改多個列的列名56
3.1.13 給所有列名添加前綴和后綴57
3.1.14 修改列數(shù)據(jù)的數(shù)據(jù)類型59
3.1.15 修改列數(shù)據(jù)61
3.1.16 修改列數(shù)據(jù)的格式63
3.1.17 將列中的字符串數(shù)據(jù)修改為數(shù)字65
3.1.18 根據(jù)條件修改數(shù)據(jù)67
3.1.19 刪除列68
3.2 使用ChatGPT+pandas實現(xiàn)行操作70
3.2.1 直接添加一個新行70
3.2.2 利用已有行數(shù)據(jù)通過計算得到新行72
3.2.3 插入行74
3.2.4 修改行名76
3.2.5 修改行數(shù)據(jù)78
3.2.6 刪除行79
3.3 使用ChatGPT+pandas實現(xiàn)值操作81
3.3.1 修改單個值81
3.3.2 修改局部區(qū)域中的值82
3.3.3 修改所有值84
3.4 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)查詢86
3.4.1 單條件查詢86
3.4.2 多條件查詢88
3.5 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)排序89
3.5.1 單條件排序89
3.5.2 多條件排序91
3.5.3 提取前3名數(shù)據(jù)92
3.6 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)篩選94
3.6.1 單條件篩選94
3.6.2 多條件篩選96
3.7 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)排名97
3.7.1 中國式排名97
3.7.2 美國式排名99
第4章 使用ChatGPT+pandas實現(xiàn)多個文件數(shù)據(jù)的整理102
4.1 使用ChatGPT+pandas拆分數(shù)據(jù)102
4.1.1 簡單拆分——垂直102
4.1.2 簡單拆分——水平104
4.1.3 根據(jù)變量的值將數(shù)據(jù)拆分到不同工作簿中105
4.2 使用ChatGPT+pandas合并數(shù)據(jù)107
4.2.1 合并不同工作表中的數(shù)據(jù)107
4.2.2 合并不同工作簿中的數(shù)據(jù)112
4.3 使用ChatGPT+pandas拼接數(shù)據(jù)114
4.4 使用ChatGPT+pandas連接數(shù)據(jù)116
4.5 使用ChatGPT+pandas追加數(shù)據(jù)118
第5章 使用ChatGPT+pandas實現(xiàn)文本數(shù)據(jù)的整理120
5.1 使用ChatGPT+pandas提取子文本120
5.2 使用ChatGPT+pandas改變文本大小寫122
5.3 使用ChatGPT+pandas實現(xiàn)分列124
5.3.1 使用單一分隔符進行分列124
5.3.2 使用多種分隔符進行分列126
5.3.3 按照固定寬度進行分列128
5.4 使用ChatGPT+pandas合并文本129
5.5 使用ChatGPT+pandas查找和替換子文本132
5.6 使用ChatGPT+pandas輸出文本的格式133
第6章 使用ChatGPT+pandas實現(xiàn)日期時間數(shù)據(jù)的整理136
6.1 使用ChatGPT+pandas實現(xiàn)時間點數(shù)據(jù)的整理136
6.1.1 從給定的日期時間中提取單位對應的數(shù)字136
6.1.2 計算給定日期是星期幾138
6.2 使用ChatGPT+pandas實現(xiàn)時間段數(shù)據(jù)的整理140
6.2.1 計算兩個日期之間的間隔天數(shù)140
6.2.2 已知起始日期和間隔天數(shù)計算終止日期142
第7章 使用ChatGPT+pandas實現(xiàn)時間序列數(shù)據(jù)的整理144
7.1 時間序列數(shù)據(jù)144
7.1.1 創(chuàng)建時間序列數(shù)據(jù)144
7.1.2 從文件中導入時間序列數(shù)據(jù)146
7.2 使用ChatGPT+pandas實現(xiàn)時間序列數(shù)據(jù)的常見處理148
7.2.1 數(shù)據(jù)查詢148
7.2.2 數(shù)據(jù)篩選149
7.2.3 數(shù)據(jù)轉換150
7.2.4 數(shù)據(jù)匯總152
7.3 使用ChatGPT+pandas實現(xiàn)時間序列數(shù)據(jù)偏移153
7.3.1 日期時間偏移153
7.3.2 工作日偏移154
7.4 使用ChatGPT+pandas實現(xiàn)時間序列數(shù)據(jù)平滑156
7.5 使用ChatGPT+pandas實現(xiàn)時間序列數(shù)據(jù)重采樣158
第8章 使用ChatGPT+pandas實現(xiàn)分類數(shù)據(jù)的整理160
8.1 分類數(shù)據(jù)160
8.1.1 創(chuàng)建分類數(shù)據(jù)160
8.1.2 設置分類值162
8.1.3 對分類數(shù)據(jù)進行排序163
8.2 使用ChatGPT+pandas處理分類數(shù)據(jù)164
8.2.1 查詢分類165
8.2.2 增加分類值166
8.2.3 修改分類值167
8.2.4 刪除分類值168
第9章 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)預處理170
9.1 使用ChatGPT+pandas處理重復數(shù)據(jù)170
9.1.1 整行數(shù)據(jù)重復的處理170
9.1.2 指定數(shù)據(jù)重復的處理172
9.2 使用ChatGPT+pandas處理缺失值173
9.2.1 發(fā)現(xiàn)缺失值174
9.2.2 刪除缺失值176
9.2.3 填充缺失值177
9.3 使用ChatGPT+pandas處理異常值179
9.3.1 發(fā)現(xiàn)異常值179
9.3.2 刪除異常值182
9.3.3 替換異常值184
9.4 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)轉換185
9.4.1 數(shù)據(jù)標準化186
9.4.2 數(shù)據(jù)歸一化187
?
第10章 使用ChatGPT+pandas實現(xiàn)統(tǒng)計分析190
10.1 使用ChatGPT+pandas實現(xiàn)描述性統(tǒng)計190
10.1.1 描述數(shù)據(jù)集中趨勢190
10.1.2 描述數(shù)據(jù)離中趨勢192
10.1.3 描述數(shù)據(jù)分布形狀194
10.2 使用ChatGPT+pandas實現(xiàn)分組統(tǒng)計195
10.2.1 分組描述性統(tǒng)計195
10.2.2 分組提取首次數(shù)據(jù)和末次數(shù)據(jù)197
10.2.3 多條件匯總199
10.2.4 分組按條件統(tǒng)計201
10.3 使用ChatGPT+pandas實現(xiàn)頻數(shù)分析202
10.4 使用ChatGPT+pandas實現(xiàn)數(shù)據(jù)透視表204
10.4.1 創(chuàng)建數(shù)據(jù)透視表204
10.4.2 設置數(shù)據(jù)透視表中值的輸出格式206
10.4.3 處理數(shù)據(jù)透視表中的缺失值208
10.4.4 設置數(shù)據(jù)透視表的聚合函數(shù)210
10.4.5 為數(shù)據(jù)透視表添加行匯總和列匯總213
10.4.6 設置數(shù)據(jù)透視表中數(shù)據(jù)的顯示方式215
10.4.7 對數(shù)據(jù)透視表中的數(shù)據(jù)進行排序217
10.4.8 聚合函數(shù)為連接字符串219
第11章 使用ChatGPT實現(xiàn)與Excel工作表相關的設置223
11.1 使用ChatGPT+xlwings設置Excel工作表223
11.1.1 設置邊框223
11.1.2 設置背景色227
11.1.3 設置字體229
11.1.4 設置對齊方式231
11.1.5 單元格合并和取消合并233
11.2 使用ChatGPT+OpenPyXL設置Excel工作表235
11.2.1 設置邊框235
11.2.2 設置背景色238
11.2.3 設置字體239
11.2.4 設置對齊方式241
11.2.5 單元格合并和取消合并242
第12章 使用ChatGPT實現(xiàn)數(shù)據(jù)可視化244
12.1 使用ChatGPT+xlwings實現(xiàn)數(shù)據(jù)可視化244
12.1.1 條形圖244
12.1.2 餅圖247
12.2 使用ChatGPT+OpenPyXL實現(xiàn)數(shù)據(jù)可 視化249
12.2.1 條形圖249
12.2.2 餅圖251
12.3 使用ChatGPT+Matplotlib實現(xiàn)數(shù)據(jù)可視化252
12.3.1 條形圖253
12.3.2 餅圖254
第13章 Python語法基礎256
13.1 常量和變量256
13.1.1 常量256
13.1.2 變量及其聲明、賦值和刪除256
13.1.3 變量的數(shù)據(jù)類型257
13.2 數(shù)字257
13.2.1 整型數(shù)字257
13.2.2 浮點型數(shù)字258
13.3 字符串258
13.3.1 創(chuàng)建字符串258
13.3.2 索引和切片258
13.3.3 字符串的長度和大小寫259
13.3.4 字符串的分割、連接和刪除259
13.4 列表260
13.4.1 創(chuàng)建列表260
13.4.2 添加列表元素261
13.4.3 索引和切片261
13.4.4 刪除列表元素262
13.5 元組 262
13.5.1 元組的創(chuàng)建和刪除263
13.5.2 索引和切片263
13.6 字典263
13.6.1 字典的創(chuàng)建263
13.6.2 字典元素的增、刪、改、查264
13.7 表達式265
13.7.1 算術運算符265
13.7.2 關系運算符265
13.7.3 邏輯運算符266
13.8 流程控制266
13.8.1 判斷結構266
13.8.2 循環(huán)結構——for循環(huán)268
13.8.3 循環(huán)結構——while循環(huán)268
13.9 函數(shù)269
13.9.1 內部函數(shù)269
13.9.2 標準模塊函數(shù)和第三方模塊 函數(shù)269
13.9.3 自定義函數(shù)269
第14章 pandas基礎271
14.1 NumPy數(shù)組271