第二周在学习python里面的pandas模块和matplotlib模块,问题点的话不多,但是比较使用,记录一下。
并且在第二次测试时候学习到了一些要注意的点,算是查漏补缺了
MySql中学习到的点:
1.在查询语句前加上expain可以查询这个查询语句的执行顺序,一般来说会返回ID还有相应的执行列表、执行方法,ID列中,ID值越大越先执行,ID值相同的按由上到下执行
Python中学习到的点:
1.在命令行CMD中,如果输入python并没有执行python程序,或者运行相应py文件不行的时候,解决方法一般为设置目录地址至相应的目录下,或者在环境中添加目录地址
2.set()方法为返回列表中的唯一值的字典类型
3.在对列表进行增删元素的时候,元素增删后相应地其后面元素也会向前后移动,其相应的索引也会发生变化,所以在用for循环循环遍历元素或者索引的时候,要注意元素位置是否改变,如果不想被元素的移动影响,就可以设置for循环的对象时使用同名的备份列表进行操作,加上全切片即可[ :]
pandas模块遇到的问题点:
一般来说都是对CSV文件进行读取操作,但是也会有一些比较特殊的非CSV文件(如TXT文件),需要使用read_table()方法进行数据文件的读取,而不管是读取CSV文件或者其它格式数据文件分隔符号一般有这几种:
1.逗号,
2.制表符\t
3.空格
4.\s+
\s+以前没有见过,经过网上一查,说\s+是一种正则表达式,它可以代替很多字符,包括:
\f -> 匹配一个换页
\n -> 匹配一个换行符
\r -> 匹配一个回车符
\t -> 匹配一个制表符
\v -> 匹配一个垂直制表符
所以在以不同空白数量的作为分隔符号的数据文件中,使用\s+来读取数据文件可以避免数据在格式上的错误编排
网友评论