这一周,学习时间有点少,挤了10个小时出来,并且学习效果还不怎么好,主要在周六和周天完成。
学习的内容有:
- P4的数据集探索项目
- P3的线性代数项目修改
P4的数据集探索项目
P4的项目是选择泰坦尼克号的数据集,然后直接分析了性别、年龄和船舱等级对生存率的影响。
分析之前,我以为男性、青年(20到30岁)的生存率更高,而船舱等级则没有什么概率。在经过一波数据分析之后,很是意料之外,发现原来儿童、女性、头等舱才是生存率更高的一类。这是为什么?
然后查了资料才知道,这是因为在泰坦尼克号要沉没的时候,船上的口号是先让妇孺坐上救生艇,这才造成儿童、女性的生存率更高(汗,原谅我看泰坦尼克号的时候还是个小孩,啥都不记得了)。又因为,头等舱相对来说救生艇更多,所以生存率更高。
在做这个项目的时候,发现自己Pandas很多功能还是不太会用,连知道的groupby和图形显示都没用好。还有在分析的时候不全面,导致最终项目被打回来了,然后重新花了两个小时改了一遍,重新提交了项目。
P3的线性代数项目
这个项目应该是上上周就打回来了,因为我拖着,然后一直没鸟它。最终,这周六不得不面对它了,重新再做题的时候,发现有些知识又不太记得了。不过,好在有项目打回来的反馈,照着上面的弄就行了。
其中,花时间最久的是最后一道线性回归的代码,当时我是直接用前面的结论来作为条件,然后使用解二元一次方程组搞定了。但是,打回来说不行,需要使用前面造好的轮子做,好吧,那我就照着这个思路来做。代码一删,改起来,OMG,为啥报错?稍微一改,发现整个代码报了很多错,最后,代码看来看起,测来测去,然后发现是数据结构不对,我是产生了一维数组,而需要的是二维数组?为什么要二维数组?好吧,看了许久许久,得三个小时吧,折腾来折腾去,然后看看题目,模拟前面题目中的数据结构放进去,嗨,居然通了,为何?再仔细一看,原来前面的题目条件如下:
这个X和Y都是二维数组,原来是题目没看懂,后来再一想,唐晓阳前面也碰到过这个问题。
总结与计划
总结:这一周一直在整抓数据,然后学习时间比较少,学习进度缓慢。本来是打算直接把P5搞定,然后直接学习吴恩达的深度学习课程。还有,上周说12点前睡觉的,然后没有一天做得到;然后,这一周说要写篇博客,看着时间,现在也不行了。
计划:
- 吴恩达深度学习课程
- P5的课程
- 博客两篇(补上这一周的)
网友评论