美文网首页大数据,机器学习,人工智能每周500字大数据
没有真实的业务数据?那就自己动手!

没有真实的业务数据?那就自己动手!

作者: AI课工场 | 来源:发表于2019-12-23 13:59 被阅读0次

最近小编已经将大数据系统的学习了一遍,对各个技术点已经了解清楚了,于是开始翻起了招聘网站,开始试水招聘市场。毕竟猪肉都涨价啦,小编学习了半年多的大数据没理由身价还不涨。

浏览各公司招聘需求的过程中,相应的技术点要求小编倒是明白,虽然说不上精通,但是已经足够的了解,并且也知其原理,看上去都十分的匹配,于是小编写好简历之后迅速开始了投递,接下来就是翘着二郎腿在家坐等面试。

投递100篇简历的第1天,小编脑子里满脑都是迎娶白富美的场景。

投递100篇简历的第2天,小编自信依然,脑子里满是offer收割现场。

投递100篇简历的第12天,这没道理呀,理论知识如此丰富的小编能不被相中?

投递100篇简历的第20天,小编一边吃着泡面,一边给拒绝自己的HR厚着脸皮打去了电话。而大多数的对话如下:

“HR您好,我的理论知识丰富,我被刷下来的原因肯定是您没看见,认真看一下?”“您好,您的简历我们技术部分负责人很认真看过,主要是因为您缺乏真实场景的项目开发经历”

一语点醒梦中人,难怪小编投的简历都石沉大海,可是真实场景的大数据项目依赖着大量真实的数据,这是我们自学的人很难拥有的资源,就算是网上有许多教程,但是真实的业务数据也不可能会进行提供。

这个问题一直在困扰着小编,直到小编找到了一个神奇的库——Python-faker

这个库可不是打英雄联盟那哥们儿开发的。它是一个专注于模拟生成数据的库,并且它的简单易用以及模拟数据的友好,完全可以将它生成的数据模拟出真实的业务场景。下面我们来具体介绍一下。

首先安装faker库,使用命令:pip install faker

安装完成以后,就可以自由的使用faker库了,使用的步骤非常简单

导入faker库:from faker import Faker

实例化Faker(),并传入使用中文的参数:fake = Faker('zh_CN'),这样生成的数据将是中文。

接下来就可以看看它造的数据了:

就是这样简单调用一下相关的api,它就可以给我们返回许多模拟的数据,当然你每次调用同样的方法返回的结果都是不一样的,因为它会随机的生成模拟数据。这实在是太方便了吧,那除了以上这些api,它还提供了许多其他的api和方法来模拟生成相关数据。

它可以轻松模拟个人的各种信息:姓名、年龄、手机号、地址、地理坐标、银行卡号、公司、工作类型等等等等。还能模拟爬虫中经常使用的user-agent,还可以整段文本内容、日期,甚至一键生成个人简介。

更多的模拟数据可以轻松访问其官网进行查询,有了这个库以后,小编再也不担心真实场景下的大数据开发经验了。先用它模拟100条个人信息,然后再用它模拟一些购物行为数据,用于做购物网站的数据分析,或者购物网站推荐系统的数据源都可以。

有了这个库,真实场景下的大数据开发经验根本就没问题了。先不说了,小编要开始模拟数据进行开发了,期待半个月后找到好的工作!

相关文章

网友评论

    本文标题:没有真实的业务数据?那就自己动手!

    本文链接:https://www.haomeiwen.com/subject/dnpznctx.html