作业:
重复课程代码
按要求绘制 人均GDP数据的直方图
设置图片标题和坐标轴名称
只显示人均GDP在2万美元以内的数据
设置区间数bins为30
颜色设置成绿色
人均GDP数据的直方图
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%config InlineBackend.figure_format = 'retina' # 设置图像清晰度
data = pd.read_csv('WorldIndex.csv')
data.head()
data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 177 entries, 0 to 176
Data columns (total 5 columns):
Country 177 non-null object
Continent 177 non-null object
Life_expectancy 169 non-null float64
GDP_per_capita 169 non-null float64
Population 176 non-null float64
dtypes: float64(3), object(2)
memory usage: 5.6+ KB
```python
# 删除包含缺失值的行
df = data.dropna()
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 164 entries, 0 to 175
Data columns (total 5 columns):
Country 164 non-null object
Continent 164 non-null object
Life_expectancy 164 non-null float64
GDP_per_capita 164 non-null float64
Population 164 non-null float64
dtypes: float64(3), object(2)
memory usage: 6.4+ KB
# 重新定义列名
df.columns = ['country', 'continent', 'life', 'gdp', 'popu']
plt.hist(df.gdp, bins=30, rwidth=0.9) # bins 设置区间数,rwidth设置柱子相对宽度
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.xlabel('人均GDP(美元)') # x轴名称
plt.title('人均GDP数据直方图(2015)') # 图标题
plt.xlim([0,20000]) #x轴只显示2万内的数据
plt.show()

网友评论