本书的程序主要参考了python-data-analytics
1.首先打开一个IPython NoteBook文件,在命令行中输入ipython notebook
PS:如果显示不是内部或者外部的命令,也不是可以运行的程序或者批处理文件。这可能是由于你没有安装ipython notebook.
2.导入需要用的库文件
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
from urllib2 import urlopen
3.使用pd.read_csv导入数据
pop2014 = pd.read_csv(urlopen('http://mcdc.missouri.edu/data/popests/CO-EST2014-alldata.csv'),
encoding = 'latin-1',
dtype = {'STATE': 'str', 'COUNTRY': 'str'}
)
数据的结果如下图:
4.选取感兴趣的部分
pop2014_by_state = pop2014[pop2014.SUMLEV == 40]
数据的结果如下图:
5.对结果进行排序
states.sort_values(['POPESTIMATE2014'], ascending = False)[:5]
PS:参考书上面的代码有错误,可能是作者用的pandas的库的版本比较老导致的。原作者的排序函数是sort,在我这里总是会显示没有该函数。
6.引入D3
%%javascript
require.config({
paths:{
d3: '//cdnjs.cloudflare.com/ajax/libs/d3/3.4.8/d3.min'
}
})
7.CSS样式
from IPython.core.display import display, Javascript,HTMLdisplay(HTML(""".bar {
fill: steelblue;
}
.bar:hover {
fill: brown;
}
.axis {
font: 10px sans-serif;
}
.axis path,
.axis line {
fill: none;
stroke: #000;
}
.x.axis path {
display: none;
}
"""))
8.编写JavaScript的代码
import jinja2
myTemolate = jinja2.Template("""
require(["d3"], function(d3) {
var data = []
{% for row in data %}
data.push({ 'state': '{{ row[1] }}', 'population': {{ row[5] }} });
{% endfor %}
d3.select("#chart_d3 svg").remove()
var margin = {top: 20, right: 20, bottom: 30, left: 40},
width = 800 - margin.left - margin.right,
height = 400 - margin.top - margin.bottom;
var x = d3.scale.ordinal()
.rangeRoundBands([0, width], .25);
var y = d3.scale.linear()
.range([height, 0]);
var xAxis = d3.svg.axis()
.scale(x)
.orient("bottom");
var yAxis = d3.svg.axis()
.scale(y)
.orient("left")
.ticks(10)
.tickFormat(d3.format('.1s'));
var svg = d3.select("#chart_d3").append("svg")
.attr("width", width + margin.left + margin.right)
.attr("height", height + margin.top + margin.bottom)
.append("g")
.attr("transform", "translate(" + margin.left + "," + margin.top + ")");
x.domain(data.map(function(d) { return d.state; }));
y.domain([0, d3.max(data, function(d) { return d.population; })]);
svg.append("g")
.attr("class", "x axis")
.attr("transform", "translate(0," + height + ")")
.call(xAxis);
svg.append("g")
.attr("class", "y axis")
.call(yAxis)
.append("text")
.attr("transform", "rotate(-90)")
.attr("y", 6)
.attr("dy", ".71em")
.style("text-anchor", "end")
.text("Population");
svg.selectAll(".bar")
.data(data)
.enter().append("rect")
.attr("class", "bar")
.attr("x", function(d) { return x(d.state); })
.attr("width", x.rangeBand())
.attr("y", function(d) { return y(d.population); })
.attr("height", function(d) { return height - y(d.population); });
});
""");
display(Javascript(myTemolate.render(
data=states.sort_values(['POPESTIMATE2014'], ascending=False)[:10].itertuples()))
)
最后显示的效果,如下图:
PS:如果你用的是谷歌浏览器,可能看不到这个结果,这是由于把弹出的窗口给屏蔽了。解决的方法是在
浏览器的叹号位置,
把弹出窗口改为允许就可以了。
网友评论