美文网首页视觉艺术
python数据分析-生成随机数据文件

python数据分析-生成随机数据文件

作者: 叶子陪你玩 | 来源:发表于2020-06-02 18:11 被阅读0次

数据分析肯定需要数据,这个数据一般都是来自实际学习工作业务中的,比如学校的学生成绩,淘宝京东的销售数据,视频网站不同种类的视频播放点击量等。

自己练习的话,除了可以去一些公开的数据网站下载一些数据外,也可以自己随机生成一些数据,下面就来自己生成随机500名学生成绩,为之后后面数据分析使用做准备。

数据格式如下

整个数据一共有6个类型,分别是["姓名","班级","性别","语文","数学","英语"]。姓名需要500个不同的名字,班级一个5个,分数从1-100。

image

生成500个不同名字

这么多名字肯定不能自己手打,先到百度找到百家姓,刚好100个,作为我们的第一个名字。

image image

接下来把这些名字分成一个个字符,这个直接利用字符索引就可以,但是这个字符串里面有空格,还有一些隐藏的符号,需要提前处理一下,用到字符串的替换就可以搞定。

打印长度发现有126个字符,里面有换行符,空格,还有一个好像是中文的空格,管它啥,直接替换成空值,就相当于删除了。

image

使用replace进行替换删除操作,打印长度100,26个多余的都删除了。

image

接下来在创建第一个名字,这里就简单的用"一二三四五"表示,循环拼接,生成500个名字。

image

如果想要打乱顺序的话,利用random.sample就可以了。

image

名字到这里就搞定了。

生成每个学生数据

学生有姓名,班级,性别,三科分数,这里全部利用循环生成,每个学生数据存为一个列表,一个是500个数据,最后添加到data里面,打印20组查看符合要求。

image

将生成的数据写入文件

写入数据比较简单,利用pandas库直接创建一个DataFrame二维数据结构,利用to_excel将整个数据写入文件,这里的index=False是为了不把自动索引写入。

image

本地生成一个文件,打开查看。

image

读取文件查看数据

利用read_excel读取之前的数据文件,打印查看数据的基本情况。

image

自己生成一个数据文件就到这了,数据来源一般除了自己生成,下载公开的数据文件,还有就是自己去网上爬取网站的数据了。

(全文完)


长按二维码,加关注!叶子陪你玩

欢迎转载,转载请注明出处!
欢迎关注公众微信号:叶子陪你玩编程
分享自己的python学习之路

相关文章

  • python数据分析-生成随机数据文件

    数据分析肯定需要数据,这个数据一般都是来自实际学习工作业务中的,比如学校的学生成绩,淘宝京东的销售数据,视频网站不...

  • 数据可视化<第三天>

    随机漫步 在本节中,我们将使用python来生成随机漫步数据再使用matplotlib呈现数据随机漫步:每次行走都...

  • python必知必会6

    Python中生成随机整数、随机小数、0—1之间小数方法 生成随机整数使用random.randint()生成随机...

  • C++生成随机数据方法

    生成随机int数组方法(数据未知) 生成随机Int序列(给定数据) 生成随机序列(给定数据)--模板函数

  • 91、随机漫步

    我们将使用Python来生成随机漫步数据,再使用matplotlib将这些数据呈现出来。随机漫步的路径是这样的:每...

  • 随机漫步-Python 实现

    使用Python来生成随机漫步的数据,再使用matplotlib以引人瞩目的方式将这些数据呈现出来。随机漫步是这样...

  • Python学习笔记

    一张图让你学会Python 机器学习算法的随机数据生成总结

  • python生成随机数

    python 生成随机数

  • Python-随机产生数据

    Python-随机产生数据 1.random.random() 用于生成一个0到1的随机浮点数 2.random....

  • 数据分析day1:json数据处理

    数据来自《利用python进行数据分析》附加数据文件,本篇使用采集的用户匿名数据 很乱,很难看懂 可以看到输出的第...

网友评论

    本文标题:python数据分析-生成随机数据文件

    本文链接:https://www.haomeiwen.com/subject/mtoyahtx.html