想必很多人都用过Pandas来处理数据,作为Python数据科学领域的顶级库,Pandas确实有着强大的数据处理能力。特别是结合Jupyter Notebook平台,简直可以称作编程里的Excel。
![](https://img.haomeiwen.com/i13723999/6b612609cb3b4f83.png)
Pandas是代码工具,不能像Excel那样通过软件界面操作,有时候也给数据探索带来小小的困扰。
比如说,你想简单探索下数据集的结构、描述统计结果、可视化图表等等,如果能绕开代码,直接通过GUI界面来操作,会更加方便。
D-Tale就可以完美实现上述功能,作为Pandas生态的辅助GUI工具,能读取DataFrame数据,供使用者进行探索分析。
![](https://img.haomeiwen.com/i13723999/2e77b8acf70cf1be.png)
D-Tale是 Flask 后端和 React 前端的组合,提供了简洁的GUI分析界面。它可以在PyCharm、Jupyter、命令行中打开,其功能包括筛选、排序、高亮、拼接、数据转换、描述统计、可视化等等。
尤其是可视化能力,D-Tale可以像Power BI那样实现拖拉拽的图表制作,而且提供了很多图表类型,包括折线图、柱状图、直方图、饼图、热力图、三维图、词云图、地图等等。
如果你经常使用Pandas进行数据分析,那么便可以试试D-Tale,它通过pip进行安装,非常简单。
pip install D-Tale
安装好后,导入D-Tale中的show()
方法,通过show()
就可以读取DataFrame数据,激活GUI分析界面。
![](https://img.haomeiwen.com/i13723999/2bb81f045c5603e0.png)
该GUI界面提供了多种数据工具,可以在菜单中进行选择使用。
![](https://img.haomeiwen.com/i13723999/753148ac21abd1e9.png)
你可以对数据集进行筛选、排序、隐藏、调整大小等操作:
![](https://img.haomeiwen.com/i13723999/f2b3a5842e4e738e.png)
还可以查看数据集的描述性统计结果:
![](https://img.haomeiwen.com/i13723999/12ea2e2f65a06ed6.png)
分析数据的缺失值情况:
![](https://img.haomeiwen.com/i13723999/ada0d31592c0f9fc.png)
![](https://img.haomeiwen.com/i13723999/9c80d3fb9bd62642.png)
对数据集进行热力图展示:
![](https://img.haomeiwen.com/i13723999/8c49e8113d7218e8.png)
进行多元化的图表分析:
![](https://img.haomeiwen.com/i13723999/5c168d2e0d85eb62.png)
![](https://img.haomeiwen.com/i13723999/7be6735faad2bfbc.png)
![](https://img.haomeiwen.com/i13723999/34e9d569ad37ff37.png)
![](https://img.haomeiwen.com/i13723999/c33934e5a7578853.png)
![](https://img.haomeiwen.com/i13723999/92c0a7bc5c4c4653.png)
还可以制作有向图:
![](https://img.haomeiwen.com/i13723999/3663922af4d32b69.png)
如果你想导出数据集,D-Tale能很方便地实现:
![](https://img.haomeiwen.com/i13723999/ee8ed64441a3893c.png)
总的来说,D-Tale是一款Pandas辅助工具,可以高效地进行探索性分析。但D-Tale并不能替代Pandas来处理数据,因为它的功能还是有限的。
![](https://img.haomeiwen.com/i13723999/ddd7d6c72d2b6520.png)
网友评论