美文网首页数据蛙数据分析每周作业
数据蛙就业二周学习小结

数据蛙就业二周学习小结

作者: BeNzOnE | 来源:发表于2021-01-10 22:02 被阅读0次

第二周在学习python里面的pandas模块和matplotlib模块,问题点的话不多,但是比较使用,记录一下。
并且在第二次测试时候学习到了一些要注意的点,算是查漏补缺了

MySql中学习到的点:

1.在查询语句前加上expain可以查询这个查询语句的执行顺序,一般来说会返回ID还有相应的执行列表、执行方法,ID列中,ID值越大越先执行,ID值相同的按由上到下执行

Python中学习到的点:

1.在命令行CMD中,如果输入python并没有执行python程序,或者运行相应py文件不行的时候,解决方法一般为设置目录地址至相应的目录下,或者在环境中添加目录地址
2.set()方法为返回列表中的唯一值的字典类型
3.在对列表进行增删元素的时候,元素增删后相应地其后面元素也会向前后移动,其相应的索引也会发生变化,所以在用for循环循环遍历元素或者索引的时候,要注意元素位置是否改变,如果不想被元素的移动影响,就可以设置for循环的对象时使用同名的备份列表进行操作,加上全切片即可[ :]

pandas模块遇到的问题点:

一般来说都是对CSV文件进行读取操作,但是也会有一些比较特殊的非CSV文件(如TXT文件),需要使用read_table()方法进行数据文件的读取,而不管是读取CSV文件或者其它格式数据文件分隔符号一般有这几种:
1.逗号,
2.制表符\t
3.空格
4.\s+
\s+以前没有见过,经过网上一查,说\s+是一种正则表达式,它可以代替很多字符,包括:
\f -> 匹配一个换页
\n -> 匹配一个换行符
\r -> 匹配一个回车符
\t -> 匹配一个制表符
\v -> 匹配一个垂直制表符
所以在以不同空白数量的作为分隔符号的数据文件中,使用\s+来读取数据文件可以避免数据在格式上的错误编排

相关文章

网友评论

    本文标题:数据蛙就业二周学习小结

    本文链接:https://www.haomeiwen.com/subject/tmplaktx.html