美文网首页DATA ANALYSIS PROCESS
Matplotlib和Seaborn之什么是整洁的数据?

Matplotlib和Seaborn之什么是整洁的数据?

作者: IntoTheVoid | 来源:发表于2019-12-16 10:24 被阅读0次

    什么是整洁的数据?

    在这门课程中,你的数据必须是某种整洁格式。简而言之,整洁数据集是满足以下条件的表格数据集:

    • 每个变量占一列
    • 每个观察值占一行
    • 每种观察单位是一个表格

    下面的前三个图片描述了一个整洁的数据集。这个整洁的数据集来自医疗保健领域,有两个表格:一个是患者表格(包括患者 ID、姓名和年龄),一个是治疗表格(包括患者 ID、患者服用的药物,以及药物剂量)。

    *整洁数据集的每个变量都必须具有自己的列*.png 整洁表格中的每个观察值都必须具有自己的行.png 整洁数据集中的每个观察单位都必须具有自己的表格.png

    下个图片描述了相同的数据,但是呈现格式不够整洁(还有其他可能的非整洁格式)。Drug ADrug BDrug C 列应该变成一个“Drug”列,因为这是一个变量。整个表格应该拆分为两个表格:一个患者表格和一个治疗表格。

    上述非整洁数据表示只遵守了整洁数据的第二条规则:每个观察值各占一行.png

    相关文章

      网友评论

        本文标题:Matplotlib和Seaborn之什么是整洁的数据?

        本文链接:https://www.haomeiwen.com/subject/bolnfqtx.html