看完本文收获
- 从 Kaggle 下载数据集。
- 使用 python 和 pandsql 库访问数据集。
- 使用 python 和 sql 实现了基础过滤技术。
- 使用 python 和 SQL 实现中间聚合和连接。
正文
预处理传入的数据是数据工程师一直在做的事情。Python 和 SQL 是执行这些活动的两种最常用的语言。过渡到此类角色的专业人员可能是使用 SQL 的家庭,因为这是一种广泛接受的用于处理关系数据库的语言,但在学习 Python 等新语言时会遇到困难。python 中的 Pandasql 库允许用户在 python 环境中使用 SQL。在本文中,我尝试教授 python 和 pandasql 的基础知识,以便您可以在 Jupyter 笔记本环境中互换使用这两种语言。
网友评论