在Python的学习过程中,如果尝试分析金融大数据,那么TuShare是个必不可少的工具。该工具包通过重新清洗公开免费的财经数据,提供了方便快捷的接入方式。
该工具包依赖的库比较多,所以在安装的时候比较繁琐,且容易出错。建议遇到错误时,先重装Python,然后逐一安装TuShare依赖的库。
安装命令: pip install tushare
最基本的依赖库是numpy 和 pandas,以及bs4等。均可以通过pip方式在线安装。
安装完毕后,就可以用简单的Python语句来调用数据了。
需要强调的是,TuShare库里不仅仅有股票数据,而是一个综合的财经库。只是因为股票数据数据量比较大,特别锻炼数据分析能力,所以才选择股票数据练手。其余的数据也是很有意思的,比如全国电影票房排名:
可以查CPI:
再比如货币供应量(咦,央妈最近没怎么放水啊?):
生成Excel表是这样:
在使用TuShare之前,先import相关的库
然后调用TuShare的函数,ts.get_today.all()
由于几乎所有的TuShare数据都是pandas的DataFrame格式,所以可以很方便的使用to_excel生成excel格式。
该条命令生成的报表如下:
调用历史行情的函数是 ts.get_hist_data()
调用实时行情:ts.get_today_all
获取实时大单数据:ts.get_sina_dd()
之前我用Ruby写代码的时候,通过新浪股票接口、网易财经接口、腾讯证券接口,获得了实时和历史数据,所以在理解TuShare的时候就比较容易。事实上,TuShare作者也在公开文档上表示使用了这些接口。TuShare的存在,大大降低了财经大数据分析的门槛。
网友评论