pandas学习总结-----读取和加载数据

作者: 九日照林 | 来源:发表于2019-08-22 00:25 被阅读0次

使用Python进行数据标准化
使用Python进行数据标准化
尝尝pandas(6)
pandas学习总结-----读取和加载数据
使用Python进行数据标准化
python和R写出表达矩阵为稀疏矩阵matrix.mtx.gz
数据竞赛
pandas常用操作
02. Pandas读取数据
Python—pandas 和 numpy 进行处理数据（实际应

读取相应的文件类型

常用参数

图上标黄的这样几个参数可以关注下。

指定列名

names可以在加载文件的时候，传入列名，结合header=None
比如

pd.read_csv('examples/ex2.csv')

names = ['a', 'b', 'c', 'd', 'message']
pd.read_csv('examples/ex2.csv', names=names, index_col='message')

0
在这里就传入了列名的列表names，并且用index_col指定了message这一列作为索引。

不想要一次过加载那么多数据的时候

当你不想要一次性读取全部数据的时候，请想起nrows, skiprows, chunksize这三个参数。
nrows可以用来选择性读多少行，当你只想要查看数据的总体概况而不想全部读入的时候，可以选定读几行。
skiprows可以跳过不读的行数。
chunksize适用于迭代式地读取操作，产生的是迭代器TextParser。

for gm_chunk in pd.read_csv(csv_url,chunksize=500):
    print(gm_chunk.shape)
(500, 6)
(500, 6)
(500, 6)
(204, 6)

对日期进行处理

parse_date和date_parser可以对日期文本进行解析转化成日期格式的字段。

操作数据库的两种方式

使用sqlite3进行操作

import sqlite3
query = """
CREATE TABLE test
(a VARCHAR(20), b VARCHAR(20),
 c REAL,        d INTEGER
);"""
# 连接数据库
con = sqlite3.connect('mydata.sqlite')
# 对返回的连接对象进行execute和commit()
con.execute(query)
con.commit()

使用sqlalchemy方式

这种方式会简单很多，直接先创建一个查询引擎，然后用read_sql方法使用创建的引擎engine去执行语句。

import sqlalchemy as sqla
db = sqla.create_engine('sqlite:///mydata.sqlite')
pd.read_sql('select * from test', db)

以上主要是pandas操作常用的csv文件和数据库的方式，其他的pandas还可以读取web api，json文件等等，这些就先不展开讲了。

网友评论

本文标题：pandas学习总结-----读取和加载数据

本文链接：https://www.haomeiwen.com/subject/ddxgsctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

pandas学习总结-----读取和加载数据

读取相应的文件类型

常用参数

指定列名

不想要一次过加载那么多数据的时候

对日期进行处理

操作数据库的两种方式

使用sqlite3进行操作

使用sqlalchemy方式

相关文章

使用Python进行数据标准化

使用Python进行数据标准化

尝尝pandas(6)

pandas学习总结-----读取和加载数据

使用Python进行数据标准化

python和R写出表达矩阵为稀疏矩阵matrix.mtx.gz

数据竞赛

pandas常用操作

02. Pandas读取数据

Python—pandas 和 numpy 进行处理数据（实际应

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读