继续前面的练习,之前的文章参考:
- pandas实例-了解你的数据-Chipotle
- pandas实例-筛选与排序-Chipotle
- pandas实例-数据可视化-Chipotle
- pandas实例-了解你的数据-Occupation
- pandas实例-筛选与过滤-Euro 12
- pandas实例-筛选与过滤-Fictional Army
- pandas实例-聚合-Alcohol Consumption
- pandas实例-聚合-Occupation
- pandas实例-聚合-Regiment
- pandas实例-Apply-Student Alcohol Consumption
- pandas实例-Apply-Crime Rates
- pandas实例-Merge-MPG Cars
- pandas实例-Merge-Fictitious Names
- pandas实例-merge-House Market
- pandas实例-Stats-US_Baby_Names
- pandas实例-Stats-Wind Statistics
接下来的几篇是关于可视化的
这一篇是关于Titanic的,使用的也是Titanic的数据集
df = pd.read_csv(data_path , sep=',')
一共891条记录,12列
1. Set PassengerId as the index
重置索引
df.set_index('PassengerId' , inplace=True)
df.head()
2. Create a pie chart presenting the male/female proportion
绘制饼图
g = df.groupby('Sex')[['Sex']].count() / df['Sex'].count()
ax = g.plot.pie(y='Sex' , autopct='%.2f%%')
ax.legend(loc='upper left')
这里有两点,一个是怎样将计算性别的占比,另一个是怎样使用饼图来展示
3. Create a scatterplot with the Fare payed and the Age, differ the plot color by gender
绘制散点图,这个直接使用pandas话就有点儿麻烦了
所以,来看看最近学习的seaborn吧,参考:
sns.relplot(x='Age' , y='Fare' , hue='Sex' , data=df)
4. How many people survived?
df['Survived'].value_counts()
5. Create a histogram with the Fare payed
这回是一个直方图
pandas.DataFrame.plot.hist
df['Fare'].plot.hist(by='Fare')
这里默认的箱数是10
这是直方图,我就顺便看了下,这个Fare分布情况
df['Fare'].sort_values().reset_index(drop=True).plot.line()
好了,主要还是练习可视化的使用,收工先。
网友评论