社科文论选摘 理论研究

论文写作三部曲之二:技巧

赵庆秋

2022年07月19日 07:15

姚洋
爱思想网作者专栏

一、关于理论 

1、如何做理论?

同学们在教科书和论文中读到的模型,基本都是从假设开始一步步推导。如果同学们就此认为做学问也应该延续这种套路,就完全错误了。教科书上出现的模型已经打磨了无数遍,写的时候一定是按顺序写,但其构思过程一定是反向,即先构思一个符合直觉的“故事”,然后用日常语言表达出来。对同学们而言,这一过程颇有些挑战性。有的同学能写出理论模型,但不会用日常语言表达。如果出现这种情况,我觉得是对理论模型理解不到位。

我认为,写一篇理论文章好比讲一个故事,先构建一个符合直觉的框架,然后找到相应的经济学理论,最后用严谨的数学语言表达出来。

如何把你的理论成功“推销”给期刊审稿人?这其实是“一锤子买卖”。多数时候,审稿人审稿只看整个“故事”是否合理,即文章的推导是否有问题,至于文章的假设正确与否,审稿人通常很少在意。这样的审稿标准可能放过一些错误,导致很多名人发表的文章也存在逻辑错误。我们常说做理论难,难就难在这里。论文作者既需要讲好故事,还需要确保假设合理,模型运用得当。大家切忌从现成的假设出发,用标准的模型来研究现实问题。 

2、做理论模型的步骤

1) 确定理论和因果关系。简单说就是先把理论这个“故事”讲起来。

2) 构造一个可以产生预期结论的经济机制。在这个过程中一定要防止“短路”。我反对大家做那种X影响Y的回归分析,因为X影响Y太直接,也是“短路”的一种。好比用一顶帐篷来隔绝蚊子,然后讨论会产生什么结果,这样的研究有什么意义?

3)确定模型和假设。以上步骤可能需要重复很多次,最后确定的假设一定是通过模型的机制能够得到想要的、结论最少的假设。

在美国威斯康星大学读书时,我也曾陷入写不出理论模型的困境。当时我咨询一位数学系博士该如何解决这个问题,他的回答让我醍醐灌顶。他说,任何结论都可以推导出来,关键看假设是什么。

不难看出,理论都是建构出来的,不是必然的东西。很多人在发表文章时都会提到“我在这里做一个技术性假设”。对理论文章而言,假设能否推导很重要,但使用“技术性假设”这样模棱两可的词汇,就可以一笔带过。由此可见,经济学比较仁慈,给了研究者一些假设的空间,但也不能太离谱,不能从假设直接推导到结论。倘若别人看到假设就知道结论,这样的研究也没有意义。

理论很奇妙,有时我们自己构建了一个理论模型,推导到最后发现有如此多的命题可以证明,这是一种令人兴奋的经历。我建议年轻同学们不要怕,要勇于尝试。我虽是农经系出身,但我也写理论文章,直到现在还在写,马上要出版的一篇文章就是聚焦“中国选拔制度里忠诚与能力的平衡”这一问题。这是一篇经验研究文章,但也有一个理论模型,指导后面的计量研究。在写理论模型的时候,如果你的模型很复杂,可以先用一个简单的模型把直觉告诉读者。 

3、如何检验理论模型的好坏?

在这一点上,我们往往被Friedman迷惑了。Friedman认为,只要模型和现实吻合,这个模型就是对的。我曾经问过芝加哥联储的主席,研究宏观的学者怎么知道采用的模型是对的?芝加哥联储的主席表示,如果模型能推导出来,并且和现实的数据都能吻合,就相信这个模型是对的。

这就是典型的Friedman标准,我觉得这个标准不够完善。除了数据,我们还要看机制是不是合理,假设是不是合理,模型是不是应用得当。这样的要求可能让我们这些做新政治经济学的人更发愁,因为新政治经济学缺乏一个广为接受的模型,又如何能用模型去说服别人,证明模型应用得当?所以说经济学不是纯粹的科学,科学不会在意模型是否精巧。我认为经济学多少还有点像文学,还有点理论物理的意思。在经济学的范畴里,找到一个理论模型并不意味着成功,还要看结论是否符合直觉,是否比现存理论得到更多、更一般化的结论,以及结论是否经得起数据的检验。这些都非常重要。 

二、关于经验研究 

1、好的数据是第一要务

如果只用省级数据或者国家层面的数据做研究,除非论文立意特别好,否则很难发表。

还有一种方法是自己收集数据。博士生们一定不要怕自己收集数据,我有好几位博士生都这样做。自己收集数据虽然辛苦,但此后很长一段时间的研究都可以吃这些数据的“老本”。因此,博士生要注意给自己建一座“城堡”,在获取独一无二的“垄断”地位的同时,也让别人无法“攻破”你的“城堡”。在我看来,“城堡”可以是独家数据,也可以是超强的研究能力,比如特别擅长写模型,熟练运用各种方法等。

作为一名研究者,以上这些学术素养,至少要具备一样,不然如何在学术界立足? 

2、做经验研究也要讲一个故事

研究者必须找一个好的经济学问题。这或许是我的个人偏见,因为我不喜欢那种X怎么影响Y的简单逻辑。如果你的选题背后没有经济学内容支撑,那平日里接受的经济学训练意义何在?

我建议大家先用图表把数据看一遍,主要因果关系必须在平均意义上显著。这一点我曾反复强调,如果数据在平均意义上都不显著,你就别做了,那你是在拷问数据。你做的就是“稻草学问”,没有意义。

做经验研究最好也要有个理论模型,不是构建一个理论,而是要提出一个分析框架,分清解释变量和控制变量。否则等这个结论出来时,再回过头做合理化的解说就有可能走不通。

我们还要学会用回归来讲故事。只做一条回归远远不够,你可能要做一万个回归,最后从中挑选出十个,讲一个逻辑自洽的故事。切记不要放太多的回归结果,这样做容易暴露自己的逻辑漏洞,哪怕结论是显著的,有些逻辑链条可能接不上。

写文章有个诀窍,你给读者呈现什么,读者就会沿着你的思路去思考,因此没必要去把旁枝末节也放到文章里,你的文章应该只突出一个核心问题。

在这一过程中,我们也要避免cherry picking。所谓cherry picking就是对自己有利的都讲出来,对自己不利的就不讲。大家可能会说,刚才说的挑选十个回归,这难道不是cherry picking?我想说的是,如果这里面有cherry picking,那这个故事本身就有问题,你要重新选一个故事。 

3. 关于估计方法

在计量研究中,通常有三种方法,即简化式估计、结构式估计和结构化估计。

简化式估计就是回归式之间没有内在联系。其优点是简单直接,看平均意义上的效果,对数据的要求也不高。在我看来,哪怕是简化式估计,也应该能够讲一个逻辑一致的故事,这个一定要记住。简化式估计的缺点是容易出现内生性的问题,无法研究太复杂的机制。

结构式估计是多条有内在关系的回归式。优点是可以用来讨论较为复杂的机制,缺点是对数据的要求较高。我的博士论文是做中国土地问题,当时威斯康星大学的要求是都要做结构式估计,这意味着必须得有理论模型,从模型里推导出回归,这个回归就非常复杂。

最近有家杂志邀请我审一篇文章,关于中国农村土地问题。这篇文章做的是简化式回归,没有任何内在逻辑,相关机制就表现不出来。

当然结构式估计对数据的要求比较高,发表也比较难。我们曾有一篇文章,评审人就认为理论模型写得非常好,但经验研究不好,数据无法支撑这样的估计,因此毙掉了这篇文章。由此可见,结构式估计不容易。但我还是鼓励大家尽量做,这是一个很好的训练,也有可能激励你真正地把经济机制搞出来。

还有一种做法是用模型做估计。其优点是可以解决内生性问题,可以用来做反事实检验。你可以先想好一个模型,然后用数据校准模型。接下来就可以用这个模型来做政策分析、反事实分析。这种方法对数据要求没那么高,对模型的要求高一些。缺点是容易陷入“套套逻辑”,结论高度依赖于这个模型的设计。所谓“套套逻辑”就是为了得到结论而修改模型,自己解释自己。

以上三种方法各有优缺点,大家使用的时候要小心。 

4、如何解决内生性问题

产生内生性问题的原因很多,共时性问题、遗漏变量问题,联立方程偏差问题都能带来内生性问题。

该如何解决内生性问题?

1)使用但不迷信工具变量。

工具变量需要满足两个条件:一是相关性,二是排他性。相关性比较容易满足,排他性则比较难以满足。一个合格的工具变量必须和处理内生变量高度相关,同时又对因变量没有直接作用,也就是说能够影响工具变量的只有工具变量,工具变量不应直接影响结果变量。这个要求确实很难满足。

比如把殖民地的死亡率作为制度的工具变量,然后得出结论:制度会影响长期经济增长。然而殖民地的死亡率高,意味着当地的自然环境比较差。我们早就知道“自然环境比较差的地方经济表现不好”,因此很难排除殖民地的死亡率通过其他途径直接影响长期经济表现的可能性。要解决这个问题,就需要从其他方面着手,你就要通过其他方面来想办法,做无数的回归。我曾辅导一名硕士生做过类似的尝试,刚开始的时候我们使用工具变量,后来从其他方面入手,开始多做一些回归,逐渐解决了这个问题。 

2)如果有面板数据,可以借此打个时间差。

面板数据代表时间上的变化。所谓“外生性”,指先发生的事情相对于后发生的事情而言,一定是外生的,除非它们长期受到第三方因素的影响。倘若有面板数据,长期影响就可以被固定下来,成为固定效应。这时候就可以把X变量作为外生性变量。

关于面板数据的应用技巧还有很多。我的一位硕士生——徐轶青,做得非常好,如今是斯坦福大学政治系教授。轶青在硕士期间做的硕士论文,博士期间不断修改,最终发表在政治学最好的杂志上。这篇文章的焦点之一是“如何度量非正式制度”这一内生性很强的问题。当时我们想的办法是用村庄级别面板数据的特点,利用村庄内部的变化,看选举如何激活宗族这个非正式制度。村庄选举出的村主任来自最大姓,说明他拥有了宗族赋予的非正式权威。只要选举比较随机,我们就可以认为说这是外生的。

断点回归也是一种解决办法,可以就此找到很多切入口。

我有一位来自北大马克思主义学院的学生,他用中央苏区作为断点回归,我认为这是个很好的办法。如果能辅以自然实验或者拟自然实验,效果会更好。

因此,做经验研究一定要从多个方面验证自己的结论,要知道经验研究只是检验了一个理论预测,现有数据支持理论预测,不等于理论就是对的,因为可能存在其他理论,其结论也和经验发现一致。也就是说,能够得出同样结论的理论模型可能不止一个,其他机制也有可能推导出同样的结论。所以经验研究一定要找到排除其他理论的解释,此外也要时常扪心自问:做的这些回归能否支撑结论?经常做一些符合直觉或理论差异化效果的检验,构建反事实检验也是必要的步骤。

做经验研究时,同学们要时刻想象有一位审稿人坐在你面前,追问你各种问题,你要想方设法用计量结果回答他。“假想审稿人”不一定会挑战你故事中的细节,但他可能会挑战你使用的方法。


]]>

2022年07月19日 15:15
2929
论文写作三部曲之一:选题