在Python的学习过程中,如果尝试分析金融大数据,那么TuShare是个必不可少的工具。该工具包通过重新清洗公开免费的财经数据,提供了方便快捷的接入方式。
该工具包依赖的库比较多,所以在安装的时候比较繁琐,且容易出错。建议遇到错误时,先重装Python,然后逐一安装TuShare依赖的库。
安装命令: pip install tushare
最基本的依赖库是numpy 和 pandas,以及bs4等。均可以通过pip方式在线安装。
安装完毕后,就可以用简单的Python语句来调用数据了。
需要强调的是,TuShare库里不仅仅有股票数据,而是一个综合的财经库。只是因为股票数据数据量比较大,特别锻炼数据分析能力,所以才选择股票数据练手。其余的数据也是很有意思的,比如全国电影票房排名:
![](https://img.haomeiwen.com/i193571/ffe9b7b3f2466155.png)
可以查CPI:
![](https://img.haomeiwen.com/i193571/2b322eeea25b7d0b.png)
再比如货币供应量(咦,央妈最近没怎么放水啊?):
![](https://img.haomeiwen.com/i193571/52207b3ef6e06c80.png)
生成Excel表是这样:
![](https://img.haomeiwen.com/i193571/79bdc82df0287d9d.png)
在使用TuShare之前,先import相关的库
![](https://img.haomeiwen.com/i193571/51997447245e3ff9.png)
然后调用TuShare的函数,ts.get_today.all()
![](https://img.haomeiwen.com/i193571/0fef4025785fc42b.png)
由于几乎所有的TuShare数据都是pandas的DataFrame格式,所以可以很方便的使用to_excel生成excel格式。
该条命令生成的报表如下:
![](https://img.haomeiwen.com/i193571/3ae4f6f115081202.png)
调用历史行情的函数是 ts.get_hist_data()
![](https://img.haomeiwen.com/i193571/0d53dd6c27dfa303.png)
调用实时行情:ts.get_today_all
![](https://img.haomeiwen.com/i193571/a253b75486d2ec5e.png)
获取实时大单数据:ts.get_sina_dd()
![](https://img.haomeiwen.com/i193571/9b5bef8ca46017af.png)
之前我用Ruby写代码的时候,通过新浪股票接口、网易财经接口、腾讯证券接口,获得了实时和历史数据,所以在理解TuShare的时候就比较容易。事实上,TuShare作者也在公开文档上表示使用了这些接口。TuShare的存在,大大降低了财经大数据分析的门槛。
网友评论