美文网首页stata连享会
Stata现场专题:2019.1.17-27

Stata现场专题:2019.1.17-27

作者: stata连享会 | 来源:发表于2018-09-17 16:18 被阅读144次
    Stata现场班-2019寒假

    - PDF 课程大纲-



    A. 课程概要

    时间: 2019 年 1 月 17-27 日
    地点: 北京 中国青年政治学院
    授课教师: 连玉君 (初级+高级) || 江艇 (论文班)


    》》》欢迎加入 [STATA学习-连享会] QQ群 225012362,一同学习 Stata!

    》》》申请时,请填写如下备注信息:Stata连享会邀请-学校简称-姓名


    B. 讲授嘉宾简介


    连玉君

    连玉君
    连玉君 ,经济学博士,副教授,博士生导师。2007年7月毕业于西安交通大学金禾经济研究中心,现任教于中山大学岭南学院金融系。主讲课程为“金融计量”、“计量分析与Stata应用”、“实证金融”等。已在《China Economic Review》、《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》等期刊发表论文60余篇。连玉君副教授主持国家自然科学基金项目(2项)、教育部人文社科基金项目、广东自然科学基金项目等课题项目10余项。目前已完成 Panel VAR、Panel Threshold、Two-tier Stochastic Frontier 等计量模型的 Stata 实现程序,并编写过几十个小程序,如 xtbalance, winsor2, bdiff, hausmanxt, ttable3, hhi5, ua等。连玉君老师团队一直积极分享Stata应用中的点点滴滴,开设了 [Stata连享会-简书][Stata连享会-知乎] 两个专栏,并定期在微信公众号 (StataChina) 中发布精彩推文

    江艇

    江艇
    江艇,香港科技大学商学院经济学博士,中国人民大学经济学院副教授,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,美国哥伦比亚大学商学院访问学者。主要研究领域为经济增长与发展、城市经济学、新政治经济学,在Economics LettersReview of Development Economics、《经济研究》、《管理世界》、《世界经济》等国内外著名学术刊物上发表多篇论文,曾应邀在多所高校讲授“应用微观计量经济学”短期前沿课程并广受好评。



    1. Stata初级班


    • 授课嘉宾: 连玉君 (中山大学)
    • 时间: 2019年1月17日-19日 (三天)
    • 地点: 北京市海淀区 中国青年政治学院
    • 课程详情: http://www.peixun.net/view/307_detail.html
    • 授课安排
      (1) 授课方式:采用 Stata15 软件,中文多媒体互动式授课方式
      (2) 授课时间:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

    1.1 课程导引

    实证分析中,最伤神和耗时的事情莫过于研究设计和数据处理。在以往的授课中,很多同学和老师都是在听完了高级班的课程以后,又返回头来听初级班的内容。他们有一个共同的感触就是,没有一个扎实的基础,以及对计量经济学和Stata整体架构的认识,后续的学习成本会越来越高。

    在初级班中,我力求将三天的课程设置成一个比较完整的体系,目的有二:

    其一,希望大家经过三天的学习(尚需另外花费1-2个月的时间演练吸收),能对基本的统计和计量分析方法有所掌握,能读懂多数期刊论文中使用的分析方法;

    其二,希望诸位能建立起 Stata 的基本架构,熟知 Stata 能做什么、如何做?以期为后续学习打下宽厚扎实的基础。

    翻阅 Top 期刊上的论文,你会发现多数论文并没有使用非常复杂的方法,关键在于论文的想法或视角比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了 2-3 篇比较经典的论文,展示这些方法的合理应用。

    内容安排上,基本上遵循了由浅入深,循序渐进的原则。

    第 1-3 讲依序介绍 Stata 的基本用法、数据处理和程序编写,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益。

    第 4-5 讲介绍文献中使用频率最高的线性回归模型,包括 OLS 的原理、结果的解释,以及虚拟变量和交乘项的使用等。对于这些内容的深刻理解和熟练掌握,构成了后续,多种主流实证模型的基础,例如,目前文献中广泛使用的固定效应模型 (FE),倍分法 (DID),断点回归设计 (RDD) 等方法,本质上就是在传统的线性模型基础上,增加一些虚拟变量或交乘项,配合巧妙的研究设计,来实现对不可观测的个体效应的控制,以及对政策效应的估计。

    第 6 讲介绍固定效应模型 (FE),是第 4 讲和第 5 讲内容的延伸和应用,也是目前解决遗漏变量和内生性问题比较常用的方法。

    具体说明如下:

    第 1-2 讲中,我会以一篇文章为实例,说明 Stata 的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。

    第3讲介绍 Stata 编程的基础知识。但凡提及写程序,很多人都会产生恐惧心理,其实,一旦掌握了最基本的原理和语法格式,Stata 中的程序设定并没有想象的那么困难。更为重要的是,对于多数人而言,由于并不需要写完整的 ado 文档,因此只需要学会最基本的条件语句和循环语句即可,难度又会进一步降低。

    第 4 讲和第 5 讲介绍实证分析中的模型设定和结果解释问题。很多人会觉得 OLS 很简单,但 Top 期刊中使用最多的仍然是 OLS,如何合理的构建模型、解释结果便成为实证分析中必须掌握的。我精选了大家经常面临的几个专题并结合论文进行讲解,包括:虚拟变量的使用、交叉项的使用和解释、分组回归的合理设定和假设检验,还有在经济学和金融学中相对较新的 R2 贡献度分析。

    第 6 讲介绍了目前广泛应用的 面板数据模型。由于面板资料的获取越来越方便,目前多数研究中使用的都是面板数据。在讲解这些模型的基本思想和估计方法的过程中,笔者会将重点放在模型含义和应用范围上来。例如,对于同一笔数据而言,何时采用 OLS 进行估计,何时采用 FE 估计?不同的方法之间有何差异和关联?结果背后的经济含义如何解读?掌握这些方法有助于大家合理控制内生性问题,以便得到更为可信的结论。

    1.2 课程大纲(Stata初级班)

    连玉君主讲-Stata寒假2019-初级班课程大纲



    2. Stata高级班


    • 授课嘉宾: 连玉君 (中山大学)
    • 时间: 2019 年 1 月 21 日- 23 日 (三天)
    • 地点: 北京市海淀区 中国青年政治学院
    • 课程详情: http://www.peixun.net/view/307_detail.html
    • 授课安排
      (1) 授课方式:采用 Stata15 软件,中文多媒体互动式授课方式
      (2) 授课时间:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

    2.1 课程导引

    Stata高级班包括6个专题,重点讲述各类面板模型以及一些新近发展的内生性处理方法。主要涉及如下几个方面的内容:
    (1) 面板模型:动态面板、面板VAR和面板门槛模型(第1讲和第2讲),前者在刻画变量之间的动态关系,以及政策冲击方面非常有用;而后者则在近年中分析结构变化方面得到了广泛的应用。
    (2) 内生性问题,包括处理效应模型(第3讲);断点回归分析(RDD, 第4讲);合成控制法(SCM, 第5讲)。
    (3) 论文写作和课题申请专题。

    Stata 高级班包括 6 个专题,重点讲述各类面板模型以及一些新近发展的内生性处理方法。主要涉及如下几个方面的内容:

    • 面板模型: 动态面板模型、面板VAR模型和面板门槛模型(第 1 讲和第 2 讲),前者在刻画变量之间的动态关系,以及政策冲击方面非常有用;而后者则在近年中分析结构变化方面得到了广泛的应用。
    • 内生性问题: 包括处理效应模型(第 3 讲);断点回归分析(RDD, 第 4 讲);合成控制法(SCM, 第 5 讲)。
    • 论文写作和课题申请专题

    课程特色和内容:

    时至今日,多数领域使用的都是面板数据,也对相关的模型提出了越来越高的要求。在 第 1 讲 中,我将介绍专门用来分析变量自身以及多个变量之间动态关系的动态面板数据模型和面板 VAR 模型。这两类模型在经济增长、公司金融、国际贸易、劳动经济学等领域都得到了广泛应用。此外,在实证分析中,经常要处理结构变化问题,目前主要使用交叉项和分组回归等方式,但这两种设定方法都需要预先知道或假设结构变化点,使其合理性颇受质疑。而 第 2 讲 中介绍的面板门槛模型则基于“让数据说话”的原则,自动搜索结构变化点,从而克服了上述方法的局限。

    显然,内生性问题是困扰我们这个时代的学者的一个普遍而棘手的问题。为此,高级班将通过三个专题全面深入地介绍了内生性问题。

    第 3 讲 介绍用以解决自我选择偏误导致的内生性问题的模型。一是处理效应模型,主要应对解释变量中所包含的 0/1 内生变量;二是 Heckman 选择模型,主要应对被解释变量观察值非随机缺失问题。翻阅最近2年发表于《经济研究》、《管理世界》、《经济学(季刊)》等期刊的文章,这两类模型在处理内生性问题方面得到了日益广泛的应用。

    第 4 讲第 5 讲介绍的断点回归设计方法 (RDD) 以及合成控制法 (SCM) 则是近年来被公认为“最为干净”的准实验方法,在政策评价领域得到了特别的青睐。

    在政策评价领域,长期存在着一个空白地带:有些政策只针对某一个省或某一个州实施,此时 DID,PSM 等方法都不再适用,因为我们只有一个孤零零的实验对象!

    第 5 讲 中,Abadie, Diamond, and Hainmueller (2010, JASA) 提出的合成控制法,可以很好的解决了这类问题。他们研究了「加州」于 1989 年实施的禁烟法案的政策效果。其基本思想是,使用其他 38 个未实施禁烟法案的州的加权平均来虚构一个「合成加州」,进而对比分析「加州」和「合成加州」在 1989 年之后香烟消费量的差异,这就是政策效果!作者还进一步的使用的组合检验,以及「安慰剂检验」来确定这一结果的统计显著性。

    第 6 讲 中,我将根据个人的研究经历,分享做一篇规范的实证研究的经验。主要内容包括:论文的选题、研究贡献的挖掘和陈述,以及研究设计等。

    作为经济研究、管理世界、金融研究、会计研究、世界经济等期刊的匿名审稿人,我发现很多论文虽然有很好的想法,但往往因为如下原因而无法通过评审。其一,缺乏严谨规范的文献综述,使得读者难以判断文章的边际贡献;其二,实证分析部分虽然使用了比较前沿的方法,但基础工作不够扎实,如样本的筛选过程不严谨、离群值未妥善处理、指标的选取过于随意、结论的稳健性值得怀疑等;其三,实证结果的呈现方式不妥,分析不够深入,论文的排版不够精致,导致读者的第一印象比较差。

    对于申请课题,我感触良多。

    我于 2007 年开始自己的教师生涯,此前没有申请过任何课题,致使我在 2008 年的申请的四项课题全军覆没。痛定思痛,我收集了多位前辈的标书,反复研究,发现写论文与写标书存在很大的差异。

    论文力求清晰地呈现和解释你的研究假设和研究结果,而课题申请书则需要强调你所研究的问题的重要性和特色,这是一个更高层次的问题。由于是研究计划,不要求细节上的准确性,但问题要明确、思路要清晰,结构要合理,论证要有说服力。因此,很多时候是研究工作已经完成了十之八九,已经对问题有非常深刻的认识了,才能反向思维把标书写好。任何故弄玄虚、试图蒙混过关的想法都不可行。

    2009 年,我顺利获得教育人文社科基金和广东自然科学基金资助,2010 年进一步获得国家自然科学基金青年项目资助,此后又获得了多项课题的资助,并于 2016 年获得国家自然科学基金面上项目资助。事实上,了解了不同类型课题基金的特点,再辅以扎实的前期研究基础,获得资助并不是遥不可及的事情。

    相对于初级班,高级班的内容在难度上,虽然难度有所增加,但思路和架构更为清楚。在学习方法上,高级班与初级班有所不同。初级班的主要目的在于打下扎实的基础,建立一个完整的学习架构,而在高级班中,我则建议大家重点学习与自己研究方向密切相关的方法,通过广泛阅读文献来掌握这些方法在不同场景下的应用条件和变通方法。

    2.2 课程大纲(Stata高级班)

    连玉君主讲-2019高级班-课程大纲



    3. Stata论文班


    • 授课嘉宾: 江艇 (中国人民大学)
    • 时间: 2019 年 1 月 25 日- 27 日 (三天)
    • 地点: 北京市海淀区 中国青年政治学院
    • 课程详情: http://www.peixun.net/view/307_detail.html
    • 授课安排
      (1) 授课方式:采用 Stata15 软件,中文多媒体互动式授课方式;
      (2) 授课时间:上午 9:00-12:00,下午 14:00-17:00 (17:00-17:30答疑)。

    3.1 课程导引

    在过去几期的培训结束后,我们都会收集学员的建议。大家都非常迫切地希望能够精讲一些经典论文的实证分析过程,对自己在初级和高级班的所学有一个整体的认知。

    对于已经开始尝试独立开展研究工作的学员而言,大家明显地感觉到,研究设计是最棘手的问题。在之前有导师指导或带领的情况下,研究主题和研究内容都是预先给定的。此时,完成一篇论文相当于在做一个命题作文,而一旦开始独立门户,最大的挑战是找到合适的研究主题,做一个可靠的研究设计。这其实也是实证分析工作中最难的部分。

    在本次的学术论文班中,我们将挑选一些发表于顶尖期刊(包括 AER,QJE,JHR 等)上的代表性论文,详细讲解每篇论文的实证分析过程,剖析作者的研究思路、研究设计、内生性问题的处理、稳健性检验,以及对结果的详细剖析。我们会提供重现每篇论文所需的所有数据和程序文件,以便保证各位可以在听课后反刍,并将这些论文中的分析方法迁移到你的研究中去。

    精讲并重现经典论文,有如下两方面的好处

    一方面,这些论文的研究设计都非常出色,我们可以借鉴并在博采众长的基础上,不断改进自己的研究设计思路和方法。只有去拆解和重现这些论文,才能够感受到作者的思考过程和写作意图,从而从实质上提高我们自身的分析和研究能力。

    另一方面,这些论文涵盖了目前实证分析中的主流方法,更为重要的是,每一篇论文通常会综合使用多种分析方法,这对于我们理解和灵活应用初级班和高级班所学的计量方法大有裨益。

    3.2. 专题介绍:Stata 学术论文班

    下面对课程中涉及的主要论文作简要介绍,以便各位了解此次课程的重点所在。

    第 1 讲中介绍的 Rajan and Zingales (1998) 的论文是交互项模型的经典之作。该文讨论金融发展如何通过放松企业的外部融资约束而促进增长,并用法律起源作为金融发展水平的工具变量。文章的计量模型的设定非常简洁,但行文论证极其精彩。我们不但可以学到如何用交叉表直观展示研究结果、如何构造指标来传达结果的经济含义;而且可以学到为什么要使用外生的调节变量来讨论因果关系的作用机制;更可以感受到作者为了排除各种竞争性假说所做的巧妙努力。

    第 2 讲介绍的 Nunn and Wantchekon (2011) 的论文是展示工具变量方法各种技巧的洋洋大观之作。该文讨论历史上的非洲奴隶贸易如何型塑了今天人际间的不信任,并用种族到海岸线的距离作为奴隶贸易强度的工具变量。文章先使用了 OLS 方法,然后评估 OLS 估计结果在多大程度上受到选择性偏误的影响;接着使用了工具变量方法,并通过“无第一阶段”证伪检验 和“工具变量疑似内生”证伪检验来论证工具变量的合理性;最后展示了如何通过精妙的控制来讨论因果关系的作用渠道。

    第 3 讲介绍的 Imbens (2015) 是由匹配方法的扛鼎人物 Imbens 所分享的关于如何正确使用匹配方法的最新指南。我们知道,匹配方法为数众多,而且可以灵活操纵的空间也很大,匹配变量的选择更是有很多讲究,这使得匹配估计的结果往往不太稳健。我们从匹配方法的工作原理讲起,深入剖析其与 OLS 的异同,向学员传达匹配方法的思想实质。然后根据 Imbens 的建议,从样本平衡性检验倾向得分估计、样本删截、估计方法选择等各个环节逐一讲解匹配方法的操作细节。

    第 4 讲介绍的 Aidt and Franck (2015) 是一篇在截面数据中综合运用 OLS 方法、匹配方法和工具变量方法的顶刊文献。该文讨论 1830 年代英国各地区斯温暴动的激烈程度如何形成了可置信的革命威胁,推动了代表新兴阶级的辉格党在议会势力的壮大,最终促成了改革法案的通过。从这篇文章中我们不但能够回顾之前所学内容,而且还能学到安慰剂检验证伪检验等新的论证技巧。

    第 5 讲介绍的 Nunn and Qian (2011) 是一篇典型的运用连续型处理与多期双重差分方法的经典文献。该文讨论土豆这一起源于新大陆的农作物在旧大陆的推广如何促进了人口增长和城市化。文章用一国种植土豆的适宜程度作为该国接受 “政策干预” 的强度,用土豆在旧大陆的大规模推广来确定“政策干预”的时点。这篇文章所运用的方法比离散型处理或两期问题更具一般性,而且 基准估计灵活估计滚动估计变动处理时点变动处理组 等实证手段也极具借鉴意义。

    第 6 讲 介绍的 Fowlie et al. (2012) 是双重差分方法与匹配方法相结合(PSM+DID)的代表作。我们首先介绍双重差分方法与匹配方法相结合的两种模式,其一是将匹配方法视为数据预处理手段,构造匹配样本再进行双重差分估计,其二是将多期问题转换为两期问题,先构造差分结果,然后进行匹配估计。前者的重点在第3讲中已经涉及,本讲介绍的论文则是对后者的应用。文章的一大亮点是尝试对“无溢出效应”和“无混淆性”这两大基本识别假设进行了间接检验。

    需要特别强调的是,论文班的学习尤其要求大家要足够努力。最基本的要求是,在开课之前,要认真研读每一篇论文,了解其研究背景、研究思路、计量方法和主要结论。虽然这些论文的研究主题与诸位所在领域可能会有比较大的差异,但是,大道至简,从这些论文中主要是学习计量方法的合理应用和研究设计的思想。

    最后的话

    需要特别强调的是,虽然论文班的学习并不要求扎实的计量基础,但却要求大家要足够努力。最基本的要求是,在开课之前,要认真的研读每一篇论文,了解其研究背景、研究思路、计量方法和主要结论。上课过程中,我会随机抽取学员来回答一些问题。同时,也建议大家在开课前务必掌握文献的检索方法,学会使用百度学术、谷歌学术和 Endnote 等文献管理软件,这助于追踪我们讲解的每篇论文的后续进展,以便发掘新的研究主题。

    虽然这些论文的研究主题与诸位所在领域可能会有比较大的差异,但是,大道至简,从这些论文中主要是学习计量方法的合理应用和研究设计的思想。

    3.3 课程大纲

    江艇主讲-Stata寒假2019-论文班课程大纲

    论文速览:




    相约 2019 Stata 寒假现场班

    时间: 2019 年 1 月 17-27 日
    地点: 北京 中国青年政治学院
    授课教师: 连玉君 (初级+高级) || 江艇 (论文班)


    》》》欢迎加入 [STATA学习-连享会] QQ群 225012362,一同学习 Stata!

    》》》> 申请时,请填写如下备注信息:Stata连享会邀请-学校简称-姓名

    相关文章

      网友评论

        本文标题:Stata现场专题:2019.1.17-27

        本文链接:https://www.haomeiwen.com/subject/cbimgftx.html