無論什么教材,都需要重視核心概念和基本原理,姚東旻教授的重視特別表現(xiàn)在:嘗試采用多種方法,力圖闡明其背后的道理和對應的數(shù)據(jù)直覺。
江西財經(jīng)大學統(tǒng)計學院講席教授 邱東
從現(xiàn)象或者果出發(fā)探尋其原因所在的過程本身就是科學研究的過程。問題在于如何推斷所要探尋的因果關系,這本身就屬于方法的問題了,也是這部教材的主題。
中央財經(jīng)大學中國財政發(fā)展協(xié)同創(chuàng)新中心首席專家 李俊生
在諸多現(xiàn)實的財政問題中,基礎性的一環(huán)是因果關系識別。本書作為微觀計量經(jīng)濟學教材,詳細介紹了當前學界常用的因果推斷方法原理與技術手段。區(qū)別于現(xiàn)有同領域教材,豐富的中國故事和精巧、直觀的Excel專欄是本書特點。
中央財經(jīng)大學教授 馬海濤
本教材首先向計量經(jīng)濟學、應用統(tǒng)計學、社會心理學以及財政學的國際
學者致敬,特別是唐納德·西斯爾思韋特(Donald L.Thistlethwaite,首次提出斷點
回歸設計原理)、唐納德·坎貝爾(Donald T. Campbell,首次提出斷點回歸設計
原理)、菲利普·萊特(Philip G. Wright,首次提出工具變量的原理)、奧利·阿
申費爾特(Orley C. Ashenfelter,早將雙重差分法引入經(jīng)濟學研究)、保羅·羅
森堡(Paul R. Rosenbaum,早提出傾向得分匹配法的原理)、唐納德·魯賓
(Donald B. Rubin,早提出傾向得分匹配法的原理)、杰姆斯·?坡↗ames J.
Heckman,首次提出樣本選擇模型)、喬舒亞·安格里斯特( D. Angrist,久
負盛名的應用微觀計量經(jīng)濟學教科書編纂者)和約恩-斯特芬·皮施克(J.rn-Steffen
Pischke,久負盛名的應用微觀計量經(jīng)濟學教科書編纂者)等。正是他們或是天才般
的,或是苦行僧般的,或是虔誠信徒般的不懈努力,才引發(fā)并推動了整個社會科學
研究領域的重大革命因果推斷革命。
推本溯源,是人類社會得以繁榮發(fā)展的基礎。無論是自然科學研究還是社會科
學研究,都集中關注因果問題。由于控制實驗可以對不可觀測的未知干擾因素加以
人為控制,因果推斷的黃金準則就是可控實驗或隨機對比對照實驗,通過有意
識地創(chuàng)造數(shù)據(jù)并加以解讀,從而得到人類理念中的因果。自然科學研究領域的
因果推斷即是如此。但在社會科學的問題研究中,這一過程大多不可行。一方面,
相比自然科學,社會科學的研究對象更加缺乏穩(wěn)定性和固定性(費曼曾經(jīng)說過物理
學家應該慶幸物理世界中的分子、原子沒有自由意志),人的主觀意識和社會
行為大多難以預測和控制,使得社會現(xiàn)象更具隨機性。另一方面,嚴格受控制的大
規(guī)模社會實驗也因為涉及人類本身而無法實施。因此,很多時候我們不得不退而
求其次,直接使用社會經(jīng)濟發(fā)展中的觀測數(shù)據(jù),而完全舍去了創(chuàng)造數(shù)據(jù) 這一
重要過程。從這個視角來說,同樣都是分析與解讀數(shù)據(jù),由于數(shù)據(jù)產(chǎn)生過程(data
generating process,DGP)大相徑庭,其解讀后的可信性也自然相去甚遠。相比
自然科學中對創(chuàng)造數(shù)據(jù)進行解讀,直接利用觀測數(shù)據(jù)進行的經(jīng)驗分析往往難以探索
復雜現(xiàn)象背后真正的因果聯(lián)系。
XIV
因果推斷初步微觀計量經(jīng)濟學導論
正是在這樣的背景下,因果推斷革命研究觀測數(shù)據(jù)的產(chǎn)生過程,巧妙地設計思
想實驗,借助觀測數(shù)據(jù)可能地模擬出自然科學研究中常見的可控實驗
或隨機對比對照實驗,實現(xiàn)了從觀察數(shù)據(jù)到創(chuàng)造數(shù)據(jù)的巨大跳躍,從
而得以展開真正的社會科學因果推斷!這一革命的影響力有多大?讀一讀近十年發(fā)
表在經(jīng)濟學期刊上的學術論文,再看一看生活中隨處可見的智能廣告推送,就
可了解大概。
遺憾的是,當前我國經(jīng)濟學教材體系,尚未完全體現(xiàn)這一重大革命。相對系統(tǒng)
地介紹社會科學中因果推斷方法的教材還不多,特別地,在日常閱讀文獻和審稿過
程中,我發(fā)現(xiàn)大量學生為了迎合前沿實證方法的學術潮流,在對各種微觀計量經(jīng)濟
學方法的基本原理完全不知的情況下就生搬硬套,從而導致終寫出的文章照貓
畫虎反類犬。由于作為運算工具的計量軟件越來越聰明,這一問題暫時被掩
蓋了。簡單運行幾行代碼,研究結(jié)果就顯示出來,但這樣的結(jié)果卻蘊藏著重大的危
機。一方面,由于不懂理論原理和方法使用的根本原則,研究結(jié)果錯誤頻出。退一
步講,即使沒有錯誤,也因?qū)ρ芯吭O計的基本思想理解不夠,難以創(chuàng)造性地設
計出更有效的思想實驗,無法有效加載因果推斷工具箱中的各種工具。這樣一
來,理論的應用層次就比較低,無法解決重大的理論和現(xiàn)實問題。
更重要的一個方面是,簡單地重復運行機械化的代碼,不去參透理論的精
髓,將使得我們的學生基本不可能創(chuàng)造性地發(fā)展出新的理論與分析工具。這一點也
可以從這本講義及引用文獻中看出。在社會科學研究的因果推斷方面,中國學者的
研究,也包括我本人的研究成果,絕大多數(shù)集中于應用,都是引用他國(主要是歐
美國家)學者開發(fā)好的工具、算法甚至案例來研究中國問題。鮮有本土學者能夠開
發(fā)出主流的、被國際學界普遍使用的因果推斷工具。作為一名高校教師,我看到如
今的局面,內(nèi)心是很難過的。我常常思索,何時我們才能越過這一關卡,應該用怎
樣的方法去跨出這一步。在一定程度上,這本教材是對該問題的自我回答。
本教材主要有以下三個特點:
,高度重視核心概念和基本原理。但考慮到教科書定律公式越
多,受眾越少,講義中列出的全部概念和公式,我認為應該都是不能再作刪減的核
心內(nèi)容。對于這些概念和公式,我們也嘗試采用多種方法,力圖闡明其背后的道理
和對應的數(shù)據(jù)直覺。
第二,為打開理論到應用的黑箱,徹底放棄了主流計量軟件,放棄簡單代
碼的解決方案,借助Excel運算表格,僅僅使用數(shù)據(jù)的四則運算(也有一些高級優(yōu)化
工具),完全實現(xiàn)當前被廣泛應用的微觀計量算法操作。這樣做的好處是:迅
XV
自 序
速讓讀者掌握基本概念和算法原理,知曉理論和數(shù)據(jù)運算如何對應;同時也幫助讀
者快速理解主流計量軟件中,一行行的代碼到底是在執(zhí)行何種運算指令。通過這樣
的訓練,讀者可以真正地打開微觀計量經(jīng)濟學這一工具箱,在遇到不同的問題時,
依據(jù)問題性質(zhì),策略性地選擇和設計實證思路。對于這一嘗試,我們已進行了7個
年頭。在此期間,很多學生因此得益,做出了非常突出的成績。
第三,通過大量的案例充分體現(xiàn)其應用性。我們反復推敲,選擇合適的案例,
重點闡述案例文章如何利用特定的數(shù)據(jù),嵌套、構(gòu)造各種自然實驗或準實驗,
進而使用微觀計量工具箱中的各式工具展開因果分析。我們特意篩選了一些具有中
國元素的案例,一個個案例以小見大,體現(xiàn)了我國經(jīng)濟改革發(fā)展的偉大成就,從而
在專業(yè)訓練中充分體現(xiàn)具有中國特色的經(jīng)濟發(fā)展道路,潤物無聲地讓我們的學生體
會理論自信與道路自信,終實現(xiàn)課程思政的專業(yè)化。
真誠地感謝邱東、李俊生、馬海濤教授,他們都是國務院學位評定委員會的委
員(統(tǒng)計學、理論經(jīng)濟學、應用經(jīng)濟學),他們的學術氣象以及對后輩學生真誠無
私的提攜和幫助,讓我深深感動,也會成為我的學術遵循與榜樣。同樣真誠地感謝
2014年至今聽過這門課程的全部學生,正是他們的包容和熱情,給了我極大的動力
和勇氣去完成這本教材。他們的點滴進步,都讓我為之歡呼雀躍。對他們的極大期
許,正是這本書終成稿的意義。特別地,對于在教材撰寫和整理過程中,付
出過艱辛努力的許藝煊、張鵬遠、崔孟奇、趙江威等博士生們,希望本教材的正式
出版,可以讓你們的進度條上多出一個令人滿意的已完成。
后,本教材的順利完成離不開家人們的支持,他們時不時在我沉思與書寫時
的提醒和打擾,讓我覺得世上的因果關系竟如此美妙,且值得珍惜。
因能力限制,本書錯誤還難免,特別歡迎讀者指正。
姚東旻
2022年1月1日
第1章 導論與核心概念
本章前言 1
本章關鍵詞 2
導入案例 2
1.1 因果性與相關性 3
1.1.1 因果性4
1.1.2 相關性4
1.1.3 因果關系與相關關系4
1.1.4 常見錯誤6
1.2 隨機分配與自然實驗 7
1.2.1 控制實驗7
1.2.2 隨機控制實驗7
1.2.3 自然實驗與準實驗8
1.2.4 自然實驗、準實驗與隨機控制實驗:相互作用9
1.3 處理效應11
1.3.1 處理、干預與處理效應11
1.3.2 反事實12
1.3.3 平均處理效應14
1.3.4 Excel專欄:平均處理效應ATE的估計 18
1.4 可觀測選擇與不可觀測選擇 21
1.4.1 可觀測選擇與不可觀測選擇定義21
1.4.2 可觀測選擇21
1.4.3 不可觀測選擇23
1.5 選擇性偏差 24
1.5.1 選擇性偏差的定義24
XVIII
因果推斷初步微觀計量經(jīng)濟學導論
1.5.2 選擇性偏差的刻畫24
1.5.3 選擇性偏差的表現(xiàn)形式26
1.5.4 選擇性偏差的分解27
1.5.5 Excel專欄:選擇性偏差分解 29
1.5.6 選擇性偏差的解決方法33
1.5.7 辛普森悖論34
1.5.8 Excel專欄:辛普森悖論 34
1.6 政策評估計量方法 37
1.7 本章總結(jié)38
1.8 經(jīng)典案例分析 39
本章習題 42
參考文獻 44
第2章 匹 配
本章前言 45
本章關鍵詞 46
導入案例 47
2.1 協(xié)變量匹配的基本思想 49
2.1.1 協(xié)變量匹配的設計思路49
2.1.2 協(xié)變量匹配的基本假設51
2.2 傾向得分匹配的基本思想 54
2.2.1 傾向得分匹配的設計思路54
2.2.2 傾向得分匹配的基本假設和性質(zhì)58
2.3 匹配的方法與規(guī)則 59
2.3.1 匹配方法59
2.3.2 匹配規(guī)則62
2.4 匹配方法的實施步驟 63
2.4.1 協(xié)變量匹配63
2.4.2 Excel專欄:協(xié)變量匹配 66
2.4.3 Excel專欄:協(xié)變量匹配后的偏差分解 69
2.4.4 傾向得分匹配83
XIX
目 錄
2.4.5 Excel專欄:傾向得分匹配 85
2.5 匹配與回歸的比較 89
2.5.1 協(xié)變量匹配與回歸的比較89
2.5.2 Excel專欄:協(xié)變量匹配估計與回歸估計的差異 90
2.5.3 傾向得分匹配與回歸的比較96
2.6 總結(jié) 97
2.7 中國故事98
2.8 經(jīng)典案例分析 100
本章習題 102
參考文獻 104
第3章 雙重差分法
本章前言 105
本章關鍵詞 106
導入案例 106
3.1 雙重差分法簡介 107
3.1.1 為什么使用雙重差分法107
3.1.2 雙重差分法的設計思路108
3.1.3 雙重差分法的前提假設109
3.1.4 雙重差分法估計量偏差的來源110
3.2 特定數(shù)據(jù)類型的雙重差分估計 112
3.2.1 混合橫截面數(shù)據(jù)的雙重差分估計113
3.2.2 Excel專欄:混合橫截面數(shù)據(jù)的雙重差分估計 115
3.2.3 面板數(shù)據(jù)雙重差分估計118
3.2.4 Excel專欄:面板數(shù)據(jù)雙重差分估計 119
3.2.5 多期DID 127
3.2.6 Excel專欄:多期DID實踐 129
3.3 中國故事134
3.4 經(jīng)典案例分析 135
3.4.1 強制許可:來自敵國貿(mào)易法的證據(jù)135
3.4.2 快樂的醫(yī)生會讓寶寶更快樂嗎?醫(yī)生的薪酬制度對產(chǎn)前護理
服務的影響139
因果推斷初步微觀計量經(jīng)濟學導論
3.4.3 美國放松銀行監(jiān)管對收入分配的影響143
本章習題 146
參考文獻 148
第4章 工 具 變 量
本章前言 149
本章關鍵詞 150
導入案例 150
4.1 工具變量的基本原理 151
4.1.1 內(nèi)生性問題及其解決方法151
4.1.2 工具變量的有效性154
4.1.3 Excel專欄:基于Excel的工具變量相關性與外生性的檢驗 160
4.1.4 工具變量的估計162
4.1.5 Excel專欄:基于Excel的2SLS估計 166
4.1.6 Excel專欄:基于Excel的瓦爾德估計 168
4.1.7 政策效應的工具變量法估計172
4.1.8 Excel專欄:基于Excel的政策效應估計 177
4.1.9 局部平均處理效應的工具變量估計原理181
4.1.10 Excel專欄:基于Excel的局部平均處理效應 185
4.2 解決內(nèi)生性問題的其他方法擴展回歸模型 189
4.2.1 Excel專欄:基于Excel的ERM對內(nèi)生連續(xù)變量處理 191
4.3 本章總結(jié)192
4.4 中國故事193
4.5 經(jīng)典案例分析 194
4.5.1 以小河流的數(shù)量和取消科舉制度之前的短期考試成績作為工具
變量來分析科舉制廢除對政治穩(wěn)定的影響 194
4.5.2 以長子的性別和孩子出生前一年的罰款率作為工具變量分析是
否是獨生子女對近視概率的影響 197
本章習題 200
參考文獻 202
目 錄
第5章 斷 點 回 歸
本章前言 203
本章關鍵詞 204
導入案例 204
5.1 斷點回歸的基本概念 205
5.1.1 從BA到RD 205
5.1.2 斷點回歸設計:SRD與FRD 208
5.2 斷點回歸的估計 211
5.2.1 RD估計的起源與背景 211
5.2.2 斷點回歸估計213
5.2.3 RD的非參數(shù)估計方法 216
5.2.4 邊界非參數(shù)回歸216
5.2.5 局部線性回歸218
5.2.6 Excel專欄:局部線性回歸 220
5.2.7 局部多項式回歸222
5.2.8 帶寬和多項式次數(shù)的選擇223
5.2.9 Excel專欄:帶寬的選擇 225
5.2.10 模糊斷點回歸估計的設計228
5.2.11 Excel專欄:模糊斷點回歸的2SLS估計 229
5.3 斷點回歸的有效性檢驗 232
5.3.1 檢驗驅(qū)動變量S的連續(xù)性232
5.3.2 Excel專欄:檢驗驅(qū)動變量的連續(xù)性 232
5.3.3 檢驗斷點處的準隨機性234
5.4 本章總結(jié)235
5.5 中國故事237
5.6 經(jīng)典案例分析 238
5.6.1 北京的限行政策238
5.6.2 高稅收與高避稅率245
5.6.3 墨西哥的毒戰(zhàn)248
本章習題 255
參考文獻 257
因果推斷初步微觀計量經(jīng)濟學導論
第6章 前沿方法介紹
本章前言 259
本章關鍵詞 260
導入案例 260
6.1 傾向得分匹配雙重差分(PSM-DID) 262
6.1.1 PSM-DID的概念 262
6.1.2 經(jīng)典案例分析265
6.2 合成控制法(SCM) 272
6.2.1 合成控制的基本概念272
6.2.2 合成控制的工作原理272
6.2.3 經(jīng)典案例分析276
6.3 三重差分(DDD) 282
6.3.1 三重差分基本概念282
6.3.2 Excel專欄:三重差分計算展示 287
6.3.3 Excel專欄:DID與DDD的比較 289
6.3.4 中國故事291
6.3.5 經(jīng)典案例分析292
本章習題 302
參考文獻 303