在开始之前我推荐大家下载使用 Anaconda,里面包含了 Spyder 和 Jupyter Notebook 等集成工具。到百度搜索一下就可以找到官方下载链接,下载个人版就可以(本文使用的 Python 版本为 3.7 ,只要大家用的是 Python 3,那么语法就和文中几乎没有差异)。
一、数据的读取
在工作中,实验数据和工作表格通常存储在 Excel 的文件中。也有人使用数据库,数据库本身自带简单的求和、计数等功能。如果做深入的数据分析,就离不开像 Python Pandas、TensorFlow 等专业工具了。数据库导出的数据文件通常为 CSV、UNL 格式。CSV 和 UNL 格式数据也可以用 Excel 打开并正常显示为表格,它们是使用特殊分隔符(比如 ,
、|
或 ;
)的文本型数据文件。用 UltraEdit 之类的纯文本编辑器打开的样子是这样的:
1.1 读取 CSV 文件
read_csv 是 Pandas 读取 CSV 文件时使用的方法。
import pandas as pd #首先引入pandas包,并称它为pd
fpath=r'e:\tj\zt1802\car.csv' #定义文件所在的位置
df=pd.read_csv(fpath,header=0,index_col=None,encoding='gbk') #read_csv读取数据
网友评论