数学理论:在意想不到的地方与实际相遇
1常听人说数学浮于实际——本来嘛,理论不同于实践,需经由依托才能应用于生活。数学研究往往先于时代,社会还没发展出合适的落脚地,很多数学理论生来就成了“遗腹子”,少人疼爱。好在她天然的严谨和逻辑,许多数学定理历经千年依然如是。然后,就在我们最最意想不到的地方与后面赶上来的生产力不期而遇,交汇处生出灿烂的数学之花。
下文选自英国皇家数学史学会会员 Peter Rowlett 编撰的 The Unplanned Impact of Mathematics 一文,我们编译了3个理论与实际相遇的故事。原文2011年7月14日在《自然》上发表。
1843年10月16日,爱尔兰数学家汉密尔顿爵士(William Hamilton)在散步时,突然想到了i²=j²=k²=ijk=-1 的方程解,并且创造了形如 a+bi+cj+dk 的四元数(a为标量,[bi + cj + dk]为矢量)。为了捕捉这一思想火花,汉密尔顿爵士顾不得保护文物,将方程刻在了正好经过的布鲁穆桥上。
这条方程放弃了交换律,是当时一个极端的想法(那时还未发展出矢量和矩阵)。四元数是复数的不可交换延伸。如把四元数的集合考虑成多维实数空间的话,四元数就代表着一个四维空间。汉密尔顿爵士本来正在研究如何把复数应用于三维空间,但桥上的灵光一现,直接把研究扩展到了四维上去。
1-R语千寻 | 两总体均值对比(t检验第二期)
2上一期我们介绍了单个总体均值的检验问题(戳这里),它是利用样本提供的信息来判断原假设是否成立。你只要把数据扔给R,然后一个t.test就搞定了,是不是很简单?今天我们要讲的是两总体的均值对比,怎么个对比法,先举个栗子。
某公司想要检验新生产的一批药对改善睡眠效果如何,假如老板说,小王你给我检验一下这药平均效果怎样啊?小王心里嘀咕了:你要检验它的均值等于多少呢?与其面壁苦想不如机智地跟老板说,老板你再给我这群人没有用这批药之前的睡眠情况数据,我就能告诉你这药有没有效果!这就是今天要讲的两总体均值的t检验。
两总体均值t检验的目的是检验两个正态分布总体的均值之间是否有显著差异。举个简单的两独立总体的栗子,我们想要比较两个不同品种鸢尾花的花瓣平均长度是否一样,在R里面怎么实现呢?回想一下,单样本总体均值检验我们用了t.test,那么这对两个总体是否一样适用呢?答案是肯定的。快快打开R跟我一起敲下下面的代码啦~
2-用科学手段研究星座理论之后,我这个唯物主义者突然觉得它有点道理…
3在研究星座的准确和科学性之前,首先应该了解十二星座在人群中的分布。不知大家有没有这种感觉,反正我身边好像是十一月、十二月出生的人特别多!
然而这种分布的不均匀性就会让我们开星座炮骂人的时候很难做到严谨科学、无懈可击。比如你开了一个星座炮说:“我发现我身边最抠门的人都是双子男!处女男们比双子男不要好太多!” 但如果人群中本来双子座就比处女座的人多,那这个星座炮就显得考虑不够周全细腻。
作为一名工科生,在开星座炮喷人之前,一定要首先考虑总体分布,利用条件概率计算后再开严谨的贝叶斯星座炮。我在统计局网站上查到了2010年第六次人口普查数据,获得了各个月份出生的人数图
AMAZING!我国十一和十二月出生的人竟然都是十月出生的人的两倍!
往前推十个月的话……这可能说明春节真的是中华民族最喜庆的日子呢……
这种年末生娃潮是否会和地域因素有关呢?比如东三省春节期间比较冷,所以……会比较麻烦,从而年末的出生率比较低?而南方相对而言就没有这么多干扰因素?
于是我以东三省、江浙沪、粤桂琼三地的数据画出了一年里每天出生人数的变化曲线,看起来这趋势差不多嘛!
以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注 Datartisan 数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!
网友评论