美文网首页计量经济学
懒作:可重复的实证研究"How to Make A P

懒作:可重复的实证研究"How to Make A P

作者: pkuzzq | 来源:发表于2018-07-23 20:56 被阅读28次

    重点:code,software 和 OS version

    • 理念的转变:从研究本身的质量向研究过程的质量转变
    • the economic literature focuses on the related problem of transparency and selection bias in methods and results in academic journals

    关于组织工作(organized your work)

    One mandatory principle for achieving reproducible research is thus to organize the whole process and, specifically, to organize all the tasks needed and involved in the process leading to publication. These ingredients need to be properly organized if the pie is to be cooked again. It should be precisely known at which steps of the recipe (phase and task of the project)which ingredients (e.g., data, methods) and what recipe are used (e.g., codes, documentation) and what are the interactions and relationships between each element to the resulting pie(e.g., project results). This process involves addressing related topics: task and documentation writing, file organization, workflow management and file manipulation. Many organizational forms can be considered: Some are relevant for individual research projects, while others are better suited for projects involving many researchers or a team.
    翻译:实现可重复性研究的一个强制性原则是:必须时刻通盘考虑整个过程,特别是组织好所有需要和参与的过程,直到最终出版。如果馅饼要重新烹调,这些原料就需要适当地组织起来。它应该确切地知道每种配方所在的步骤(项目的阶段和任务)不同配方需要不同的成分(例如,数据,方法)使用什么样的配方(例如,代码,文档)导致的各种成分相互作用后所产生可能的不同的结果(例如,项目结果)。这个过程涉及到以下主题:组织任务和文档编写、文件夹管理、时刻关注整体工作流程与进度和文件操作。许多组织形式可以被考虑:一些是与个人研究项目相关的,而另一些则更适合于涉及许团队的项目

    step1:Plan
    step2:Organize
    step3:Compute
    step4:Document
    

    组织任务与文档编写 Organizing tasks and documentation

    • 从粘贴到任务管理系统

    • 从评论到任务文档

    Information that cannot be explained within the task (documents relating to a specific ingredient such as the code) should also be documented at the task level: general choices about the project (hypothesis and decisions such as the type of modelization, the population under study, and abandoned tested directions) and technical specifications that can have an impact on the results.在任务中无法解释的信息(与特定的成分有关的文件,如代码)也应在任务级别上记录,包括:关于项目的一般选择(假设和决定,如:模型化的类型、参与研究的人员、和已经放弃的研究方向,避免重复)以及技术规范会对结果产生影响。例如,可以包括如下:包含/排除观测值的标准;为最优化选择的随机化方法、随机种子、初始值和参数稳健性的检验;呈现结果所使用的算法(插值、平滑等)

    文件夹管理 Organizing file

    集中在:目录结构和命名约定(directory structure and naming convention)

    • 目录结构:

    首先,在建构每个项目的目录结构时候,必须保证是一致的(consistency)。其次,对项目的输入和项目的产出间(input and output),必须清楚划分。

    • 文档命名:

    修正、改进、增添、评论、新想法—————每个研究者的日常。

    时刻关注整体工作流程与进度 Keeping track of the workflow

    • 图形的方式
    图形的方式
    • 文件夹命名的方式
    文件夹命名的方式
    • 个人采用
    个人采用

    处理文件夹 Handling files

    • 文档分享:Google Drive、OneDrive
    • 版本控制:Github、Gitee
    • 写作环境:Latex、WS
    • 文献管理:NoteExpress(中文)、Endnote(英文)

    为他人编程 Code for others (including your future self)

    • 使用通用的编程方式
    STATA与R R的有效性输入
    • 记录代码


      代码记录

    尽量自动化 Automate as much as you can

    • 可以自动生成文件的代码

      能够生成文件的代码
    • BAT文件做独立分区块运行——本人还不懂!

      Batch 或者 Makefile
      区块化能够保持独立性
    • 跨语言支持
      推荐:Jupyter Notebool


      Figer-201807234

    一些有价值的参考

    • STATA图表与代码

      STATA图表与代码
      STATA图表与代码
    • 可参考文献及代码来源

      软件细节

    相关文章

      网友评论

        本文标题:懒作:可重复的实证研究"How to Make A P

        本文链接:https://www.haomeiwen.com/subject/mccsmftx.html