0x00 写在前面
有一段时间没有好好写点东西了,经过前段时间的折腾和思考,总算能够静下心好好想一想后续的学习规划,顺便开始新的博客写作旅途。
0x01 我的博客时间轴
2009年~2013年
2009年,我开通的自己的第一个博客,那时候用的是用网易博客,用来装一下文艺,大概三四年,写了十多篇水文和一些小诗。(现在看起来特别逗)
2015年初
2015年初我注册了第二个博客,也是我的第一个技术博客,在csdn博客平台。 这一个博客主要用来记录自己的学习笔记,因此在博客里面写了大量的大数据生态系统的安装和使用笔记,我认为这个博客是一个踩坑系列。 同期在买了一个域名并在github上挂了一个个人的博客主页,内容和csdn同步。
2015年~2016年
15年初到16年低我写了近百篇的技术博客(应该叫安装笔记+填坑记录)。 现在回过头来看,并不是自己不想写有深度的文章,而是自己尚不能理解深刻,能安装成功Hadoop就已经迈出很大一步了,那个时候还没有太多深层次的思考。
2016年底
2016年11月,有了一个月的闲暇时期,整个人状态比较放松,就在思考该如何写一些更有意思的文章。正好在那个时期出现了简书,为了满足自己躲在角落偷偷写文章的心情,我在简书这个文艺范的平台中注册了自己的第二个技术博客。同月,写了几篇有意思的设计模式的博客,系列名为《程序员该如何管理后宫》。
2017年初
17年初来到鹅厂,继续深入我的数据开发道路,接触千亿级数据量计算和复杂业务的数据建模。 为了能够胜任工作的要求,我深入学习了几本经典的数据仓库理论书籍。晚上看书,周末总结,白天实践。经过四个月的积累,完成了我第二个相对成熟的文章系列《数据为王》,这些文章主要集中于大数据场景下的数据仓库实践,源于书本和实践,但是相对比较容易理解,我希望写的是干货,而不是晦涩难懂的理论或者满篇贴代码。这一个系列的效果比较好,我也收到了很多朋友和同事的正向反馈。
2017年第一季度结束时,我的《数据为王》系列写的差不多了,剩下几篇想写的留到以后有灵感在写。但是感觉自己的技术深度有所欠缺,因此阅读了spark的一些源码整理了一些源码阅读笔记。然后就到了今天。
0x02 想写什么?
后面想写什么? 其实我有很多想写的东西,比如分布式算法系列,大数据算法系列,机器学习系列。 当然这些都是在学习和工作过程中记笔记,目前我的掌握是不够的。
除此之外我还想写一个有意思的系列,名字还没有想好,这个系列是我对数据相关工作的一个总结。
- 我会从数据获取写起(数据获取是一个十分重要的点,这里我会先写一点和爬虫相关的东西,毕竟有了爬虫你就可以爬自己想要的各种数据了);
- 写到数据清洗(MapReduce和Spark这些框架的使用),再写到一些有数据探索(pagerank和lpa的实现,当然也少不了倒排索引和中文分词这些nlp相关的东西);
- 再接着就会写到数据管理的一些东西(这就是我擅长的数据仓库的了,维度建模和olap系列);
- 然后会写到机器学习和深度学习的一些东西(这块忘的差不多了,我会尽力捡起来并加深学习,为以后工作中的应用做准备);
- 当然还有数据可视化(用gephi和d3js怎么优雅地展示数据);
- 除此之外还有一些有意思的东西也会提到(比如图数据库的应用,一些新技术的设计)。
我希望写的是一个有意思的系列,这个系列会帮助我和其他小伙伴一起梳理和数据相关的方方面面,以实践为主导但是会附带一些理论的讲解。
文章会以中篇长度的小文为主,一篇一个小主题,自己写文字自己配图。
作者:dantezhao |简书 | CSDN | GITHUB
个人主页:http://dantezhao.com
文章可以转载, 但必须以超链接形式标明文章原始出处和作者信息
网友评论