美文网首页21世纪统计学思维
前言-21世纪统计学思维Statistical Thinking

前言-21世纪统计学思维Statistical Thinking

作者: CalvinZhu | 来源:发表于2018-11-26 22:18 被阅读0次

    本文翻译自:http://thinkstats.org/StatsThinking21.pdf

    前言

    0.1 为什么会存在这本书?

    2018年,我开始在斯坦福大学教授本科生统计学课程(Psych 10 / Stats 60)。我以前从未教过统计数据,这是一个让事情发生的机会。我对心理学的本科统计教育越来越不满意,我想为课堂带来一些新的想法和方法。特别地,我想提出一些在21世纪越来越多地用于实际统计实践的方法。正如Brad Efron和Trevor Hastie在他们的书《Computer Age Statistical Inference: Algorithms, Evidence, and Data Science》中所阐述的那样,这些通常在心理学学生的本科统计课程中讲授的方法,充分利用了当今不断增强的计算能力,以远远超出标准的方式去解决统计问题。

    课程的第一年,我使用了Andy Field惊人的绘画小说统计书《An Adventure in Statstics》作为教科书。我很喜欢这本书的内容,特别是它围绕模型构建的统计实践方式,并且在充分谨慎的情况下对待零假设检验(虽然在我看来不够充分)。不幸的是,我的大多数学生都讨厌这本书,主要是因为它需要涉及大量故事以获得统计学知识。我也发现它确实需要,因为有许多主题(特别是那些来自人工智能领域的机器学习)我想要囊括但并未在他的书中讨论过。我最终觉得学生最好能得到一本非常贴近我讲座的书,所以我开始把我的讲座写成一套最终成为本书的计算笔记本。本书的大纲与Field的书大致相同,因为讲座最初主要基于该书的流程,但内容却大不相同(而且也不那么有趣和聪明)。

    0.2 你不是统计学家—我们为什么要听你的话?

    我是一名心理学家和神经科学家,而不是统计学家。然而,我过去20年对脑成像的研究需要使用复杂的统计和计算工具,这要求我自学了许多统计学的基本概念。因此,我认为我对科学领域中哪种统计方法很重要有一种坚定的感觉。几乎可以肯定,本书中的一些内容会让一个真正的统计学家烦恼(例如,有些地方我应该对变量设置一个ˆ,但我却没有)。话虽如此,我欢迎比我具有更强的统计专业知识的读者为我提供意见。

    0.3 为什么是R语言?

    在我的课程中,学生通过使用R语言去学习分析数据。问题“为什么是R语言?”可以解释为“为什么是R语言而不是图形软件包?”。毕竟,大多数报名参加我班级的学生以前从未编程过,所以教他们编程将会减少一些统计概念的指令。我认为学习统计工具的最佳方式是直接使用数据,而使用图形包会阻碍真正理解数据和方法。此外,对于我班上的许多学生来说,这可能是他们接触编程的唯一课程。鉴于编程是越来越多学术领域的基本能力,我认为为这些学生提供基本的编程素养对他们未来的成功至关重要,并希望至少激发部分学生来学习更多知识。

    这个问题也可以解释为“为什么是R语言而不是XX语言?”。在这个问题上我更加矛盾,因为我非常不喜欢R作为编程语言(我非常喜欢Python)。我为什么会用它?第一个答案是它很实用的——几乎所有潜在的助教(我们部门的研究生)都有R的经验,因为我们的研究生统计课程实际上就使用R,他们中的大多数人对R的技能要比我做得好!另一方面,他们中很少有人具有Python专业知识。因此,如果我想要一支技术熟练的助教大军,那么使用R是有意义的。

    另一个原因是免费的Rstudio软件使新用户使用R相对容易。特别地,我喜欢RMarkdown Notebook功能,它允许将叙述和可执行代码与集成输出混合在一起。它与许多人用于Python编程的Jupyter Notebook相似,但我觉得它更容易处理,因为它只是一个纯文本文件。在我的课堂上,我为学生提供了一个问题集的骨架RMarkdown文件,他们提交添加了解决方案的文件,然后我使用一组自动评分脚本对其进行评分。

    0.4 一本开源的书

    本书旨在成为一份活文档,来源可以在线访https://github.com/poldrack/psych10-book。如果您在本书中发现任何错误或想要如何改进它,请在Github网站上提交问题,最好可以根据您建议的更改提交拉取请求。

    0.5 致谢

    我首先要感谢Susan Holmes,他首先激励我考虑编写我自己的统计书。Lucy King对整本书提供了详细的评论和编辑,并帮助清理代码,使其与Tidyverse保持一致。Michael Henry Tessler对贝叶斯分析章节提供了非常有用的评论。我还要感谢其他提供有用意见和建议的人:Wesley Tansey,Jack Van Horn。

    感谢以下Twitter用户提供的有用建议:@enoriverbend

    感谢以下个人通过Github提交的编辑:Mehdi Rahim,Shanaathanan Modchalingam

    相关文章

      网友评论

        本文标题:前言-21世纪统计学思维Statistical Thinking

        本文链接:https://www.haomeiwen.com/subject/lgwiqqtx.html