Python-Pandas的简单使用

Python-Pandas的简单使用

作者: 轻松学Python111 | 来源:发表于2018-07-31 21:05 被阅读4次

Python-Pandas的简单使用
Python-pandas
Python-pandas库 -上篇
Python-pandas库 -下篇
python-pandas & Seaborn画图
用python-pandas作图矩阵
python-pandas设置打印宽度
简单使用
Python-Pandas 如何shuffle（打乱）数据？
gorange

Pandas数据处理

1.导入库

importnumpyasnpimportpandasaspdimportmatplotlib.pyplotasplt

2.导入json文件

pandas的read_json方法将其转化为DataFrame格式

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同值的类型(数值,字符串,布尔值等);DataFrame既有行索引也有列索引,也可以看做是Series组成的字典(共用一个索引),和其他类似的数据结构比, DataFrame中面向行和面向列的操作基本上是平衡的;

DataFrame中的数据其实是以一个或多个二维块存放的(而不是列表、字典等一维数据结构), 虽然是以二维结构保存数据,但是仍然合一轻松地将其表示为更高维度的数据(层次化索引的表格型结构,这是pandas中许多高级数据处理功能的关键要素)

df = pd.read_json('/Users/zhaoluyang/Desktop/Python_全国JSON.json')

3.查看当前表的信息

df.index#查看行索引信息df.columns#查看列信息df.head()#默认查看前5行元素，括号内可任意指定数字。df.tail()#默认指定最后5行元素，同样可指定数字。df.info()#查看表整体信息。df[['ZL_Job_id','工作地点']].head()#查看df表中'ZL_Job_id'和'工作地点'两列前5个元素。

可以看见，总共有18326个行索引（18326行），15列columns分别为ZL_Job_id、公司名称、公司链接...

4.简单的数据规整

经过第3步查看发现导入的表中ZL_Job_id一列是乱序版的，并没有按照1、2、3...的次序排列。看了下json原文件发现也是乱序的，但是为了看起来美观和统一，我需要把此列按正常序号排列，然后将此列作为列索引。（因为这一列在mysql里就是我手动添加做索引来用的）此时大致需要几个步骤：

1.将df中系统自动添加的索引替换成列ZL_Job_id。

2.将原来的‘ZL_Job_id’列删除。

3.给新的索引列排序。(也可以对数据列排序df.sort_values([‘ZL_Job_id’]))

df.index=df['ZL_Job_id']del(df['ZL_Job_id'])df1=df.sort_index()#直接df.sort_index()可返回索引的结果，但之后df还是原来的结构df1[['职位名称','工作地点']].head()

5.常用的函数示例

#qw表示在df表中column=工作经验的列中，【工作经验==不限】的次数

qw=df['工作经验'][df['工作经验']=='不限'].value_counts()

#直接用value_counts()统计工作经验字段各个值出现的次数，并画图展示。PS：查询结果是Series形式（）

df['工作经验'].value_counts().plot()

一些有用的函数

unique()、describe()、groupby()、zip()

df['Names'].unique()

结果：array(['Mary', 'Jessica', 'Bob', 'John', 'Mel'], dtype=object)

df['Names'].describe()

结果：

count 1000

unique 5

top Bob

freq 206

Name: Names, dtype: object

BabyDataSet = list(zip(names,births))BabyDataSet

结果：[('Bob', 968), ('Jessica', 155), ('Mary', 77), ('John', 578), ('Mel', 973)]

相关文章

Python-Pandas的简单使用
Pandas数据处理 1.导入库 importnumpyasnpimportpandasaspdimportmat...
Python-pandas
简介为时间序列分析提供了很好的支持。名称来源于面板数据。数据结构 Series:一维数组，与Numpy中的一维...
Python-pandas库 -上篇
1、导入panda库 2、创建系列 3、索引系列 4、创建数据帧 5、索引数据帧 6、操作数据帧 7、pandas...
Python-pandas库 -下篇
11、pandas的分组操作 12、pandas的连接操作 13、pandas的时间/日期操作 14、pandas...
python-pandas & Seaborn画图
Author：杜七 Date： 2017.03.16 Python中的结构化数据分析利器-Pandas简介用Pa...
用python-pandas作图矩阵
注：本文为一篇翻译文章，来自于Visualize Machine Learning Data in Python ...
python-pandas设置打印宽度
pandas设置打印宽度当未设置打印宽度时，如果有个列存在字符串较长的情况，有可能打印显示为...，如下：设置...
简单使用
创建模型过滤器我们有一些字段和我们想让用户筛选的基础上名称、价格或release_date。我们创建一个 ...
Python-Pandas 如何shuffle（打乱）数据？
参考：https://blog.csdn.net/qq_22238533/article/details/7091...
gorange
数组中简单使用 map中简单使用

网友评论

本文标题：Python-Pandas的简单使用

本文链接：https://www.haomeiwen.com/subject/lwmhvftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

python热爱者

Python新世界

生活不易我用python

热点阅读

python热爱者

Python新世界

生活不易我用python

关于我们|服务条款|联系我们|Python-Pandas的简单使用|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！