统计学和概率论本科学过一门课,概率论和数理统计,目前留下的印象也就是期望、方差、和几个分布的图形。
猴子的课程也都听了一遍,介绍了平均数、四分卫数、标准差。概率论介绍了条件概率、大数定律。像大部分人一样把概念罗列一遍写一篇文章毫无意义。
在我不知道怎么写本周文章时,课程里的一个视频一下打通了我的任督二脉(有些夸张),这个视频让我把已经学到的理论和实际生活联系起来,用统计学的语言就是:找到了理论和实际生活的相关性。
关键是怎样把统计学方法结合到工作生活中,用数据分析这把利剑解决实际问题。
一、一小时入门统计学
如何用一个小时入门统计学,一个视频就够!bbc4的片子The joy of stats by Hans rosling 一个瑞典的教授
视频主要介绍:
1、引入:美国公布所有的公共数据
第三方如何用数据制作洛杉矶犯罪地图,将地理位置和犯罪数据联系。对数据对城市管理的作用。
点评:这就是智慧城市,对城市管理很有借鉴意义。
2、介绍统计学历史,瑞典最早开始统计,从1748年就统计所有国民的出生死亡等数据,不过瑞典那时才200万人,比较好统计。
瑞典通过统计出生率婴儿死亡率,较少死亡率。
点评:目前中国的国家管理利用数据了吗?日常新闻里统计gdp等经济数据。统计关于人的数据吗?统计学是否能对中国人的健康发挥更大的作用?
统计学在中国发挥更大作用的前提是:政府在更多方面将数据公开,并且保证数据的真实性。
3.拿到原始数据后,跟重要的是分析数据,介绍了平均数。正态分布,泊松分布。
4、数据可视化:用形象的图表
小知识:南丁格尔不仅是有名的护士,还是统计学家。她通过统计战争的死亡率,利用极方图,揭示了医疗卫生条件对降低死亡率的重要性。
5、数据的相关性,分析背后原因
吸烟肺癌是否相关?我们的观念里只记住的是相关的,外国人是经过的详细的统计论证是正相关的,而且吸烟后戒烟对降低肺癌有帮助。
点评:中国国内的媒体只是给结论,不给论证,缺少统计数据支撑。大众也没有质疑的精神,媒体说啥就是啥,容易被煽动。
6.现在统计学的发展:谷歌公司如何利用数据。
机器翻译的原理,不是学语法,而是输入所有的可能,学习所有的语言之间的相关性。
语音识别+机器翻译=同声传译,两种语言实时对话。
而实现语音识别和机器翻译都要靠统计学。
7.对科研的影响,
改变了一直以来的科研方式:现在是数据驱动的研究方法,不再依赖假设和实验。而过去“大胆假设,小心求证”,先假设一个理论,再用实验去验证。
8、最后计算机能计算感受吗?
通过爬虫抓取社交软件里i feel 之后的词,并对情绪进行排序。得到了一些有趣的结论。
收获:
- 整个视频把数据分析的流程、统计的历史和现状梳理了一遍。
- 学习数据分析的方向:用数据看清世界。人人都可以是统计学
- 学习要直接看外国视频,质量高。相关视频:the joy of data系列
Hans rosling ted视频、bbc 4的纪录片
二,人生概率论
现在是智能时代,思维也要与时俱进,从过去工业时代的机械思维,到现在的概率论思维,大数据思维。
在智能时代,具备大数据思维,通过数据直接发现相关性,并能将相关性运用到实践,并在实践中不断优化,获得相对优势。
何谓机械思维?
通过理论推导
软件需求思维,收集需求,编程,再验证,落后于实际。
何谓大数据思维?
快速迭代,发现规律,直接运用。
1、例如通过决策树对转行的分析
人生二叉树:
大概率的人生:稳定在中产,周末遛娃,每年带娃出国2次
面临风险:工作被淘汰,被ai取代,中年危机。
只有通过不断更新认知,成为掌握ai的人,而不是被ai控制的人,
2、投资all in的含义
网友评论