美文网首页Python语言与信息数据获取和机器学习
Pnadas 通过SQL处理数据并读取结果到DF

Pnadas 通过SQL处理数据并读取结果到DF

作者: ledao | 来源:发表于2017-07-27 23:03 被阅读0次

目的

在数据分析时,很多场景下是对数据进行整理、汇总和规整。虽然Pandas有类似SQL的操作,但真正的使用SQL还是方便不少。本文演示怎么通过SQL对数据进行预处理,并返回结果到DF中。

import pandas as pd
from sqlalchemy import create_engine
# default
engine = create_engine('mysql+pymysql://ledao:ledao123@localhost/pandas_learn')

编写SQL处理语句,并返回结果

pd.read_sql_query("select cityid, cellid, sum(fee) as fee_sum from cellfee group by cityid, cellid", con=engine)

即,通过Pandas的read_sql_query方法,将sql放到第一个位置,设置con=,即可将数据的预处理部分放到数据库中去做。
如果远程的数据库性能强悍,更加推荐这种方法。
数据的维护交给数据库,真的能减轻数据分析中的数据维护压力,想象一个你面对一大堆的csv文件(excel文件)的感受。

删除数据库中的表

如果是中间表,那么需要在结束流程后将临时表删除。我们通过sqlalchemy 生成的engine来实现。

engine.execute('drop table if exists todelete')

相关文章

  • Pnadas 通过SQL处理数据并读取结果到DF

    目的 在数据分析时,很多场景下是对数据进行整理、汇总和规整。虽然Pandas有类似SQL的操作,但真正的使用SQL...

  • python-读取mysql数据写入EXCEL(三)

    需求读取mysql数据,使用SQL过滤数据SQL结果追加数据到EXCEL 文件

  • 分析伯乐在线文章数据

    一、读取文章数据 pandas读取mysql数据到DataFrame中 二、数据分析 1. 查看数据 df.inf...

  • Java - Part 11

    一、JDBC批处理 批处理是指将多条SQL语句分组到批处理中,并通过对数据库的一次调用提交它们,当需要一次向数据库...

  • JDBC批量处理

    JDBC批量处理 批量处理允许将相关的SQL语句分组到批处理中,并通过对数据库的一次调用来提交它们,一次执行完成与...

  • 第十一篇学习总结

    第十一篇学习总结 一、JDBC批处理 批处理是指将多条SQL语句分组到批处理中,并通过对数据库的一次调用提交它们,...

  • pandas读取/存储数据到mysql中

    存储dataFrame数据到数据库中【to_sql】 pandas,读取或存储DataFrames的数据到mysq...

  • JDBC结果集

    JDBC结果集 SQL语句执行后从数据库查询读取数据,返回的数据放在结果集中。 SELECT语句用于从数据库中选择...

  • parquet flile split 造成的困惑

    困惑 1、spark sql 读取parquet 文件,stage生成任务4个task,只有一个task处理数据,...

  • MySQL NULL值

    MySQL NULL值处理 MySQL使用SQL SELECT命令及WHERE来读取数据表中的数据,但是当提供的查...

网友评论

    本文标题:Pnadas 通过SQL处理数据并读取结果到DF

    本文链接:https://www.haomeiwen.com/subject/jtwtlxtx.html