美文网首页我爱编程
2018年知识输出的计划

2018年知识输出的计划

作者: AmadeusBerg | 来源:发表于2018-03-26 11:02 被阅读0次

2018年已经过去四分之一了,在口号喊出来了快一个月的时间点上,先对今年知识输出的内容做一个简单的规划。

这些文章的输出是有着两个目的:一是自己的整理与总结,二是希望能借此帮助到有缘人。

Python机器学习

这个就不用多介绍了。

老实说,纯理论方面的推导我也觉得有些困难,这个领域的壁垒可以很高,也可以很浅。之所以说它很浅,是因为前人都造好了轮子,我们只是享前人种下的树荫。所以我只是比调包侠强了一些。

所谓强了一些,是我的业务经验能帮助我更好的去理解ML模型和特征工程。我写机器学习还有一个私心,就是希望靠输出巩固自己相关的知识点。

各位不会通过文章成为算法专家,也很难单靠它就转行成数据挖掘工程师。我能写的,是给业务分析师划分出一条职场通道,是为学生党带入门,是帮更多的运营和产品经理们熟悉数据挖掘和机器学习技术。

随着Google和Microsoft的在线机器学习工具的普及,是机器学习会更加平民化。随着自调参和自编码技术的发展普及,技术的上手难度会越来越低,我相信早晚有一天,业务人员也能在数据平台上通过拖拽完成模型的建立。

Python爬虫

去年Alpha Go带领起来的大数据爆发,某乎上有着各种各样的爬虫项目介绍,这就算是个凑热闹的点吧。

不过爬虫入门门槛并不高,如果有Python基础,并且不考虑分布式爬虫、反爬虫对抗等技术,一周的时间足够入门,鼓捣出一些好玩的东西。

具体涉及的内容会包括前端知识、urllib和requests的请求、beautifulsoup的网页解析,到最后Scrapy框架的使用。以大家能顺利抓取几个目标网站为结果。

掌握爬虫后,可以做两件具有性价比的事。竞品分析和数据项目,竞品分析包括但不限于对手内容的copy、活跃数据的统计,在工作中帮大家从复制黏贴的重复劳动中抽身出来。

而数据项目是新人最好的练习题,很多人问,我想转行数据分析应该怎么做?各种软硬性技能的锻炼是一方面,但是你总归要证明自己能够胜任,那么用爬虫抓一波数据作为分析练习,并以项目的形式展现出来,绝对事半功倍。

成果总是最好的证明。

你想要投电商公司,那么抓取它对标的竞争对手,可以分析一下对手有多少SKU?售卖情况?商品评论怎么样?随着时间趋势是上升还是下降?这比简历上的踏实肯干、认真努力、学习能力强等评语要靠谱多了。你是面试官,你会不会更倾心?

抓取项目我会尽量选择有意义的,比如各种内容平台的评论。而这些数据也能用在用户画像、机器学习等文章上。

数据库与数据仓库

有了分析工具,然后也有了数据,于是就是到使用数据库的时候了。

可能数据仓库的概念大家有些陌生,通常我们使用JAVA、C++写CRUB的时候只知道一个数据库。大数据到来了,ETL在后端也火了起来,很多公司都是找不到有经验的ETL或者是招不到靠谱的ETL,于是在转型的过程中因为数据质量的问题而耽搁了。

了解到数据库与数据仓库的区别之后,在这基础之上会谈一谈OLAP、BI还有数据可视化,大概率是纸上谈兵,毕竟这里没有多少实际工作经验。

最后

除去以上三个必谈的主题之外,不出意外也会触及到TensorFlow、NLP和Opencv,这些都是后话了。

回头一看,除了爬虫,其他每个系列都会十来篇往上,这都是深坑啊

虽然感觉今年有可能写不完,能写多少就尽量写吧。

先推荐两个SQL教程(这个跟写作计划没有关系):SQLZOO有合适的教程,W3school也有。

还有Python教程,入门就看廖雪峰老师的课程吧,深入的就看书吧。

——不求多,只求精。

因为是个人发文,会在微信公众号和简书上同步更新。

相关文章

网友评论

    本文标题:2018年知识输出的计划

    本文链接:https://www.haomeiwen.com/subject/brblcftx.html