钟经樊-计量经济学论文的写作方法--基于实证研究的视角

钟经樊:计量经济学论文的写作方法--基于实证研究的视角

学习计量经济学的最后目的是为进行实证研究,但对初学计量经济学的人而言,要写一篇有实证研究的报告或论文时常有不知如何着手的感觉,这里我便对实证研究的规划以及论文的写作做一些粗浅的建议。

前期规划:

1.广泛收集参考文献,决定计划的目的和范畴:

?决定所要解释的现象是什么?

?决定所要检验的假设或理论是什么?

?决定所要预测的趋势是什么?

?决定所要评估的政策是什么?

2.建构实证计量模型;

?除研读相关经济理论之外,应比较三至五篇有实证分析之文献中的实证计量模型: 确认计量模型中解释变量和应变量之间的因果关系(causality);?

厘清各模型的异同及优缺点,思考改进文献中现存模型的可能;?

最后决定实证计量模型雏形;?

?初步调查是否有相关的资料,若无则实证模型设计的再好也无用。

3.收集相关资料;

?对数据的精确性一定要严格查核,对错假漏数据要仔细修正;

?使用电子表格软件对数据列表绘图,以验证数据的逻辑合理性,对不合理的数值要有所处理; ?不论要用的是横断面数据或是时间数列,数据数目越多越好,面板数据(Panel Data)尤佳; ?对资料数值作一些整理,表列各种基本统计量(样本平均值、变异数、变量间的样本相关系数等)、变量之间的两两交互列表、做一些初步图解分析。

计量方法的执行:

1.计量方法不应太简单(例如只做到最简单的 OLS),但也不必过于复杂,应针对问题采用恰到好处的计量方法。若采用了比较复杂的计量方法,则要说明为什么简单的方法不适合。计量方法的好坏不在其复杂程度,而在于它是否能够帮我们得到正确的估计值,以了解数据中所包含的真正信息。

2.除了估计值以及对应的 t 检定外外,也可做一些 F 检定之对多个系数的假设检定。

3.回归模型的设定,尤其是解释变量的取舍,可在估计过程中不断的修正。对应变量和解释变量均可尝试诸如对数、指数、幂函数等不同的转换。这些转换方式的决定,以经济理论上的考虑最为重要,不能单只为了提高模型的配适,而盲目的做一些不合理的变量转换。

4.选取解释变量时,应有如下的考虑:

?解释变量和应变量之间的因果关系一定要正确,也就是说,解释变量是原因在先,应变量是结果在后,有一定的先后顺序。尤其要注意,有些变量数值的产生很可能是和应变量同时决定的,或是因果关系不很明确(也就是说,相对于应变量而言,这些变量是内生的),则在选取这些变量作为解释变量时,便要非常小心。解释变量的内生问题常常是研究被批评的主要原因;

?要注意解释变量的同构型,不能不分青红皂白的将一大堆彼此相关性很高的变量(包括相同变量的不同转换、或是几个变数间的各种交乘项)放进回归式内,造成严重的线性重合问题;

?经济理论所牵涉到的变量常常是无法观察到的,因此在做实证研究时必须采用替代变量(Proxy),研究者要对所选用之替代变数的合理性详加说明。由于数据总有些缺失,常有人在束手无策之下,采用了很多匪夷所思的替代变数;

?虚拟变量的定义要清楚而合理,使用要小心;

?要探讨解释变量不足、观察值有误差等数据缺失所可能造成的计量问题。

5.横断面数据要注意异方差(Heteroscedasticity)的问题,时间数列的数据则要注意干扰项自我相关(Autocorrelation)的问题。要确定时间数列的稳定性(Stationarity),若有季节变动也要加以处理。

6.模型的稳定性要注意,可能需要诸如 Chow Test 或 CumSum Test 的检验。

7.若用到 MLE 或 GMM 等非线性计算,则在撰写报告时要对数值方法的细节,诸如统计软件及数值方法的名称、起始值之选取、收敛速度、是否产生区域解(local solution)、收敛条件的设定等,均需有所说明。

8.若实证模型中有多个应变量(和对应之方程式)值得同时分析,则可考虑采用 Seeming unrelated regression 甚至联立回归模型等系统模型,以更有效的利用各回归式之间的相关性。

报告的写作:

1.首页:报告题目,作者名字,系所,学号,日期。

2.摘要:对全文宗旨作一简单描述,并简述文章的目的是对经济结构的分析,还是对未来趋势的预测,还是对政策的评估;然后简单介绍所使用的模型及变量,数据的种类及来源,所估计的模型,所采用的计量方法;最后以最主要的实证结果为终结。

3.绪论:说明研究的性质、范围和目的,并从不同角度或一个比较宽广的视野(历史、社会、文献、问题严重性等)来解释研究的重要性。

4.文献回顾:对和主题有直接和间接关系的文献做一个简单清楚有系统的回顾,和主题有直接关系但有不同结果的文献,更是要有比较完整的解释。

5.模型设定:模型有理论模型和实证模型两类。理论模型是从经济理论中直接导出,而实证模型则是从理论模型衍申出来,是要实际以资料来估计的。理论模型通常需以数学推导,因此文章中可列出一些关键的数式以帮助理论的阐述,但不应长篇累牍的堆积只有间接关系的数式。实证模型通常是以回归模型的形式表示,对模型中所涉及的变量均须给与明确的定义,对解释变量和应变量之间的关系要详尽的说明,也要解释对模型中主要系数(或由这些系数所导出之弹性、乘数等)可能数值的大小及符号有怎样的理论预期。

6.资料说明:对数据的种类,性质,来源出处,数据修订的方式,数据中可能有的错误和缺失,都要有详细的说明,最好也能将资料的基本统计量表列出来。

7.计量方法的描述:对所用到的每一个符号都要有清楚的定义。

8.实证结果的报告:

?系数估计的主要结果均须以表列出,在表中每一系数对应之变量名称要写清楚,每一系数估计值旁均须伴随一标准差(s.e.)或 t 统计量,也可加列 p 值,对于显著的估计值也可附加诸如星号之特殊标记以提醒读者。显示模型整体表现的统计量,诸如 R2(线性回归模型), F 检定统计量, Durbin-Watson 检定统计量(对时间数列资料),也可选择性的列于表内。在表的脚注中,必须说明表中所有的特殊符号和简称,表中变量名称的选取,应尽量采用有意义的中文简称,少用无意义的英文字母组合。制表的基本原则就是要让读者便捷、完整而清楚的了解估计的结果;

?对主要回归系数(或由回归系数所导出之弹性、乘数等)估计值的大小、符号及显著与否要详加讨论,对于显著的估计值更要和理论预期值比较,若有明显的矛盾,则要探讨原因;

?若能在文献中找到类似模型的估计结果,则应择要报告,并做比较;

?对重要回归系数若是得不到显著的估计值,则要探讨其中原因。也绝不能对不显著的估计值做出过度的解释,尤其不能宣称不显著的估计值支持或不支持某些特定结论。我们要知道估计值不显著,就是表示所使用的数据不能够提供足够的信息,若是没有足够的信息,当然不能够也不应该做出任何确切的结论;

?为增加文章的清晰度,能够条列的结果应尽量条列(但要注意条列式的阐述易流于机械化而让读者

失去兴趣),同样的,能够列表的结果应尽量列表,表格应尽可能的明确、独立自主而自成一体(多利用表格下端的附注详加解释表格的内容),尽可能让读者不用在文章中到处找相关说明。此外,图表也是一个非常精准有效之传达信息的方式,应多加利用;

?所有具有政策意义的重要论点都要经过假设检定的严谨统计程序探讨其显著性;

?若要根据估计模型对数据外的时期或状况进行预测,则态度必须保守谨慎,尽可能设想预测可能不准的原因;

?所有列举的统计数字应尽量保持统一的小数点位数(小数点后三位数或四位数均可),如果有很小或很大的数字,则可以用科学表示法表示(例如 1.2345 x 10-4),尽可能显示出三至五位有效数字。

9.结论:对所有重要结果做一个完整的总结,并经由理论或数据中不尽完美处的讨论,指明未来研究的方向。

10.列举参考文献。

一些注意事项:

1.正确的进行研究很重要,但如何将研究结果有条有理、完整而正确的写成报告则更是重要。由于大学教育并不重视国文(英文)写作的训练,很多学期报告的问题都在于国文 (英文)的写作。所以对报告主体完成后的文字修饰工作,一定要给与很大的重视。

2.写论文应该抱持着推销产品的心态,所以在包装产品(即写文章)之前要清楚的了解顾客(读者)的基本心理:顾客基本上是报着不太关心但走着瞧的心理,所以写文章时,便要时时设想如何能在非常短的时间内让顾客对产品发生兴趣,当然也要设想如何能让他们在将产品消化后能对产品赞不绝口。

3.大家都知道文章中每一个章节都有一个主题(章节的标题就是用来点明该主题的),但很多人似乎是不知道,文章中的每一个段落也有各自的主题,也就是说每一个段落只是用来说明一件事情的。很多人常在该分段的时候不分,以致一个段落中常挤进两三个不太相关连的主题,而让读者不易掌握文章重点。

4.相对的另一个问题是,同一个主题,也应该在同一个地方讲清楚,而不应该在文章中不同的地方重复出现(在序论及结论中对各主题之概论则例外),尤其是不应该在不同的地方出现互相矛盾的说法。但有时候在对一个主题的解释过程中,可能需要先了解一些其它的概念,因此有必要将一个主题的解释,分置于文章中两个不同的段落。若如此则在前一部份解释完成后,应预先告知往后还会有更多的说明。这种做法既让读者有一个全盘了然的感觉,也提醒自己在前后不同地方的说明要彼此呼应而不重复或矛盾。

 

第二篇:计量经济学论文写作指导

论金台 才子城 论文站

计量经济学论文指导

一、计量经济学发表期刊推荐: 《金融与经济》

《经济改革与发展》

《经济问题探索》

《世界经济文汇》

《南开经济研究》

《铁道运输与经济》

《林业经济问题》

《农村经济与科技》

《经济地理》

《经济问题》

《经济管理》

《经济林研究》

《经济学》

《经济理论与经济管理》 《计划经济研究》

《经济学家》

《农业经济》

《上海经济研究》

《生态经济》

《世界经济研究》

论金台 才子城 论文站

《税务与经济》

《企业经济》

《经济纵横》

《商业经济研究》

写作部分:

一、计量论文的两大要点是什么?

1.计量模型的建立

2.模型中的系数如何估计出来

二、如何判断计量论文的水平高低?

掌握了上面两个要点,只是说你能写出一篇计量论文,并不是说能写出一篇高水平的论文。水平的高低在于你处理这两个要点时水平的高低。

三、做计量的“杀手锏”有哪些?

所谓的杀手锏,不是指超级复杂的计量方法,而是指这种东西一旦用起来,一般不会有人来攻击。所谓的一招毙命,毙了审稿人的命。计量方法很多,可以说满天飞。但是,真正有价值的方法,被人公认为具有一定可信度的方法(所谓的“杀手锏”),只有5种(贪多嚼不烂)。并不是你所看到的所有的方法都有人信。这点大部分初学计量的人都不会意识到。看到书上介绍一个方法,就认为这是一个好方法。其实不是。你如果查阅一下国际上关于经验研究类的论文,会发现大部分论文所用方法无非是:简单回归;工具变量回归;面板固定效应回归;差分再差分回归(difference in differnece);狂忒二回归(Quantile)。

工具变量(IV)回归,这不用说了,有内生性变量,就用这个吧。一旦有内生性变量,你的估计就有问题了。国际审稿人会拼了老命整死你。国内审稿人大部分不懂这东西(除了经济研究季刊等等这类刊物的部分审稿人以外)。工具变量的选择只要掌握一个关键点就行:找一个和内生性变量有数据相关的,但是和残差没有关系的东西,这就是你的IV了。例如贸易量如果是内生的,那么你找地理距离作为IV。北京到纽约的距离,那是自然形成的,没人认为是由你的Y或者残差导致的。但是你会发现贸易量和地理距离在数据上具有相关性。这就很好。这种数据相关性越强,IV的效果就越好。就这么一段话,IV变量回归就讲完了。

在STATA里面,你直接把原回归方程写出来,然后把IV填进去就可以了,回车就得到你的结果。关键是你不一定能找到这样的工具变量。你能找到,这个工具也不大能用。不过

论金台 才子城 论文站

要注意,IV不灵不代表你不能发表。你只要找到一个IV,效果不是差的太离谱,一般都能发。当然不能发国际一流了。国内是没问题。国内审稿人没人会重复你的结果看看是否有问题,因此你说这个IV效果已经是最好的了,世界上还找不到第二个比这个更好的了,审稿人也没的话说。就发表呗!如果审稿人说,另外一个IV效果可能要比你的好。那你就采纳他的建议用他的IV,然后感谢他一下。第二次审稿就发表了,哈哈哈哈!

四、差分再差分(Difference-in-Differences),或者叫作差差分法、双差分法,是固定效应的一个变种,在估计某个事件发生带来的效应时最有用的方法,特简单。关键思想是通过差分的方法把相同的固定效应差分掉,就剩下来事件的净效应了。举一个例子你就明白怎么回事了。大家都知道买房子靠不靠学校医院等设施还是有很大差别的。ZF为了拉动某个地方的房价,直接把地铁建到那里。但是你不知道这种设施到底导致价格有多少差别。你看到学校旁边的学区房价格上升,难道一定是学区房因素导致的吗?北京房价一直飙升,很可能是学区房以外的因素导致的。现在你要检验一个假设:学区房因素导致房价上升。差分再差分,这个方法要凑效的秘诀是:学区房因素发生变化,而其他因素基本维持不变。例如ZF重新划分学区,一个著名小学突然在某个没学校的地方建分校,或者一个著名小学搬迁,这些因素导致房子是否属于学区房发生了变化。以建分校为例。建校后周围一片区域A的房子都属于学区房,这个区域以外附近区域(B)的其他房子就不算该校学区房。然后收集建校前后两个时间点上、A和B区域房价的数据。所谓的差分再差分法,就是:A区域两个时间点上的平均房价差距 - B区域两时间点上的平均房价差距 = d,这个d就是建校对房价的影响了。d是两个差距之间的差距,所以才叫做差分再差分。用计量回归把这个d给估计出来,是有办法的:

P= b0 + b1*Da + b2*Dt + d*(Da*Dt) + Xb + e

P是房价,Da是虚拟变量,在区域A则为1,否则为0,Dt是时间虚拟变量,建校后为1,建校前为0。 STATA一跑,就把d估计出来了。为什么d可以如此表示?自己思考一下啦。实在想不出来,Wooldridge的书上有精确严格的解释。这里给出一个直观的粗略解释:北京所有区域的房价每个月都在上升,因此需要控制这部分因素,这就是时间因素Dt;区域不同自然也有差别,需要控制区域位置因素,这就是Da,这就控制了即使不建校也存在的差距;控制住其他因素X,那么剩下的Da*Dt就是建校带来的房价提升效应了。这下明白了哦。

五、狂忒二回归(Quantile)是一般均值回归的一个推广。看名字挺吓人,其实很简单。如果你知道OLS是一个均值回归,那类推就可以知道1/2分位数回归。你知道的,正态分布

论金台 才子城 论文站

下,均值就是1/2分位数的地方。均值回归就是1/2分位数回归。知道了1/2回归,你自然知道1/4和3/4分位数回归了。如果还不懂,翻开伍德里奇的书,讲到简单OLS回归时,我记得有一个图,上面对不同位置的x位置画了不同的正态分布密度函数(第2版是figure

2.1,pp26,见下面)。如果是异方差问题,那么不同x位置的正太分布图的方差就有变化。这个图上注明了预测值是E(Y|X),就是Y的条件期望,就是那根回归预测直线啦。在正态分布下就是Y的密度函数的中心点的连线,就是1/2分位数点的连线。如果那条预测线画在密度函数的1/4和3/4分位数点上,那么预测结果就不是Y的均值(在非正态下可能是均值),而是1/4和3/4分位数点的预测值。这下明白狂忒二回归了吧。分位数回归就是看看那根预测直线在不同的分位数点上有什么结果,得到什么样的回归系数。通常的OLS预测直线,仅仅是一个特例而已。进一步推广,可以推广到任意分位数点回归的情况。道理一样。

相关推荐