解密大数据课程作业-直方图

作者: 游遍星辰99 | 来源:发表于2017-03-12 18:41 被阅读69次

#coding:utf-8
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
from matplotlib.font_manager import *  
weight_data=pd.read_table('weight.txt') #读入文件
weight_data.shape  #显示数据框的结构
(80, 1)
weight_data['weight'].mean() #求均值
50.7
weight_data['weight'].var() #方差
39.27594936708859
weight_data.columns
Index(['weight'], dtype='object')

myfont = FontProperties(fname='/Library/Fonts/Lantinghei.ttc')
fig=plt.figure()
x=weight_data['weight']
ax=fig.add_subplot(111)
numBins=20
ax.hist(x,numBins,color='blue',alpha=0.8)
#plt.rcParams['font.sans-serif'] = ['SimHei'] #指定默认字体,在我的系统中没有效果
plt.title(u'体重直方图',fontproperties=myfont)
plt.xlabel(u'横坐标',fontproperties=myfont)
plt.ylabel(u'纵坐标',fontproperties=myfont)
plt.show()
Paste_Image.png
df = pd.read_csv('AirPassengers.csv')
df
df['NumPassengers'].mean()
280.2986111111111
df['NumPassengers'].var()
14391.917200854701
df['NumPassengers'].min()
104
df['NumPassengers'].max()
622
bins=11
data=df['NumPassengers']
plt.hist(data, bins=bins,range=(100, 650), alpha=0.5)
plt.title('NumPassengers')
plt.show()
Paste_Image.png

从直方图上看,数据集2的分布相对均匀一些,但是从数据看,数据集2的标准差更大。用代码一步一步可以把图做出来,但是如何解读才是真正的数据分析能力,对我来说,这是更需要下功夫的地方。

遇到的问题:
使用 plt.rcParams['font.sans-serif'] = ['SimHei'] 指定中文字体在我的mac上没有作用,在字体册里搜索了一下,没有SimHei这种字体,我猜是这个原因?但matplotlib的字体也未必就是系统自带的,这个问题暂时先放着,下次找个windows里面的SimHei.ttf复制过来,看看有没有用。借鉴了 彻底解决matplotlib中文乱码问题中的方法,在系统中找到一个Lantinghei 字体文件,应该对应字体册中的兰亭黑,使用fontproperties属性指定。

相关文章

  • 解密大数据课程作业-直方图

    从直方图上看,数据集2的分布相对均匀一些,但是从数据看,数据集2的标准差更大。用代码一步一步可以把图做出来,但是如...

  • 解密大数据0305作业:直方图

    任何学习的成长,都是跳出舒适区后,从挣扎到顿悟到过程。 其实本周的作业并不限工具,至少说最好是python。于是我...

  • 第一张直方图

    课程:20170305 数据分析&统计方法论——统计学01 作业要求:画出数据集的直方图。 虽然老师给了代码,但是...

  • 数据分析作业二

    作业:重复课程代码按要求绘制 人均GDP数据的直方图设置图片标题和坐标轴名称只显示人均GDP在2万美元以内的数据设...

  • 债务违约预测之一:数据探索

    本文是解密大数据社群一期课程的结业作业。项目分为数据探索,使用sklearn完成回归和预测,利用神经网络进行预测 ...

  • 解密大数据课程作业-正态分布

    知识点 :normed=True 的含义 官方文档说明:If True, the first element of...

  • 直方图均衡的一些变体算法

    上上上上周,数字图片处理课程布置了一个作业,需要看论文实现并比较各种直方图均衡的算法: 基本的直方图均衡算法已经在...

  • R语言 -- ggplot2 学习(二)-- ‎直方图和概率密

    数据准备 直方图1 直方图2 直方图 + 概率密度图 一页多图

  • 数据分析和统计方法论-02

    课程笔记来源于是tiger的解密大数据课程。 python数据分析范式: 1. 安装anaconda 2. 安装 ...

  • 解密大数据0226大作业

    根据自己日常购物的习惯,我对淘宝和京东两家电商的购物流程分析如下: 登陆搜索-细分筛选-商品详情-支付下单-跟踪物...

网友评论

  • 鱼心DrFish:挺好的!
    有一个小细节,就是做图的时候,横坐标和纵坐标的含义最好能说清楚,比如横轴是体重,纵轴是频数。

本文标题:解密大数据课程作业-直方图

本文链接:https://www.haomeiwen.com/subject/gccxnttx.html