美文网首页呆鸟译Py呆鸟的Python数据分析
Datapane 004 - 报告 - 创建报告

Datapane 004 - 报告 - 创建报告

作者: 呆鸟的简书 | 来源:发表于2020-10-28 17:03 被阅读0次

报告将数据集、可视图等 Python 分析结果打包在一起,变为可分享的交互式文档。

简介

用 Python 做数据分析其实没必要把所有代码或 Notebook 文件都分享给用户,只需分享用户关注的内容就可以了。对普通用户来说,直接用浏览器、电子邮件、Slack 等现成的工具查看报告就够了,最好不要让他们花额外的精力学习 Python 或 Jupyter。

Datapane 允许通过编程,将 Python 分析工具创建的 pandas DataFrame、可视图及 Markdown 文本等对象打包在一起,生成报告。

创建报告

Datapane 的 Python API 支持用多种数据组件创建、保存、发布报告。

举例来说,Datapane 的 Table(表格)组件可以直接调用 DataFrame。下列代码将 DataFrame 传递至 Table 组件,只用这个组件就可以创建报告:

# simple_report.py

import pandas as pd
import altair as alt
import datapane as dp

dataset = pd.read_csv('https://covid.ourworldindata.org/data/owid-covid-data.csv')
df = dataset.groupby(['continent', 'date'])['new_cases_smoothed_per_million'].mean().reset_index()

dp.Report(
    dp.Table(df)
).save(path='report.html', open=True)

将这段代码复制到 Python 脚本,保存并运行该 Python 脚本文件,即可生成报告。

$ python3 simple_report.py

将此 HTML 文件发送给你的用户,或发布在 Datapane 公众版上,他们就可以浏览你的数据集,筛选数据,甚至可以下载 CSV 文件。

进一步完善报告

上面的报告十分基础,接下来,用可视图与 Markdown 文本点缀一下。与传统 BI 工具不同,Datapane 不依赖专用的可视化引擎,相反,它支持 Altair、Bokeh 等 Python 可视化支持库。

沿用上文的例子,用 Altair 支持库为数据绘制可视图。

本教程后续内容将沿用下列示例代码,把这些代码复制到 Python 脚本文件或 Jupyter Notebook,运行一下试试。

# simple_report.py

import pandas as pd
import altair as alt
import datapane as dp

dataset = pd.read_csv('https://covid.ourworldindata.org/data/owid-covid-data.csv')
df = dataset.groupby(['continent', 'date'])['new_cases_smoothed_per_million'].mean().reset_index()

plot = alt.Chart(df).mark_area(opacity=0.4, stroke='black').encode(
    x='date:T',
    y=alt.Y('new_cases_smoothed_per_million:Q', stack=None),
    color=alt.Color('continent:N', scale=alt.Scale(scheme='set1')),
    tooltip='continent:N'
).interactive().properties(width='container')

dp.Report(
    dp.Plot(plot), 
    dp.Table(df)
).save(path='report.html', open=True)

用上文中的命令运行该 Python 脚本,生成下图所示的报告。

支持的组件和报告的 API 详见 API 参考手册

查看报告

如前文所述,通过浏览器就可以查看报告。不过,开发时,还可以用其它方法查看与分享报告。

在私有虚拟机上使用 Datapane,把报告的可视权限设置为 ORG 时,这样,只有您所在的组织机构内部人员才能查看报告,其他人无法查看报告。

Datapane 支持 Jupyter Notebook 集成:开发报告时,不用打开新窗口,只要在 Notebook 里调用 report.preview(), 即可直接预览内嵌在 Notebook 里的报告。

下一节,介绍怎样用 Datapane 公众版或私有的 Datapane 团队版虚拟机在线发布与分享报告。

相关文章

  • Datapane 004 - 报告 - 创建报告

    报告将数据集、可视图等 Python 分析结果打包在一起,变为可分享的交互式文档。 简介 用 Python 做数...

  • Datapane - 009 API 参考手册

    报告 在本机,在Datapane 托管服务器,创建、分享报告。 创建报告对象 报告对象由一系列组件组成。所有支持组...

  • Datapane 006 - 报告 - 嵌入报告

    概览 报告发布到 Datapane 虚拟机后,可以嵌入到其它平台。 Datapane 报告可以嵌入到任何支持 if...

  • Datapane 005 - 报告 - 发布与分享

    本功能使用免费 Datapane 公众版托管平台或私有 Datapane 团队版虚拟机。 发布报告 至此,已经介绍...

  • 理性消费,养成不购买的习惯

    【阅读输出报告2022/004】 本月的第四本书,在医院等报告的间隙读完了这本讲如何养成理性购物习惯的小书,所以总...

  • 001 - Datapane 简介

    """呆鸟云:今天先发第一篇,Datapane 的简介,完整文档随后会一篇篇发出,要写数据分析报告的朋友,一定要亲...

  • Datapane 007 - 报告 - 布局与自定义

    虽然,数据分析是按一系列步骤执行的,但以一步步的形式展示分析结果却不是什么好方法 -- 对于习惯了仪表盘或 BI ...

  • 如何正确认识个人信用报告?【2】

    【江哥的信用知识卡片】Day45 《个人信用体系专题》 如何正确认识个人信用报告? 004信用报告中的信息从哪里来...

  • 第七章 使用诊断报告 - 运诊断报告内容

    第七章 使用诊断报告 - 运诊断报告内容 运诊断报告内容 当诊断报告任务运行时,它会创建一个包含基本信息和高级信息...

  • 20190723

    【今日行家行动】 001工作 002看书 003系统培训 004写运营学院报告 005带小家伙 【今日行家见识】 ...

网友评论

    本文标题:Datapane 004 - 报告 - 创建报告

    本文链接:https://www.haomeiwen.com/subject/vhmupktx.html