我的 2019 年可视化回顾

作者: Kayyyy | 来源:发表于2020-01-09 23:15 被阅读0次

    受到 podcast Data Stories2019年总结 这期节目的启发,失踪人口 Kayyyy 决定冒个泡,简单写一点关于 2019 年可视化的个人回顾。

    许多可视化领域的大咖已经从多个角度,相当全面地总结了 2019 年可视化领域的亮点、趋势和挑战,我就不多重复了,以下仅从几个个人比较关注或觉得有趣的角度进行分享。

    关键词一:机器学习/深度学习

    可视化在机器学习/深度学习领域的应用,以及反之,机器学习/深度学习技术在可视化领域的应用,有愈发受到关注的趋势。前者恰好也是我近一年多来工作中常常打交道的内容:从一开始的机器学习小白,到自学基本概念、了解该领域的常用可视化方法,到与数据科学家合作设计可视化,不可谓不是充满挑战又收获满满的旅程。我总结出了可视化在机器学习/深度学习领域比较常见的应用场景,供有意了解这个方向的小伙伴参考:

    • 数据集的分析及探索(包括特征分析)
    • 模型训练过程的监控
    • 模型训练结果展示与评估
    • 模型可解释性

    其中,目前许多工具或平台都还不具备的,最具挑战性的竞争热点是 模型可解释性 方面的可视化。模型可解释性指对模型内部机制的理解以及对模型结果的理解,通过可视化方法打开模型的“黑盒”,有利于开发人员优化调整模型,以及提高决策者使用模型预测结果时对模型的信任,因此是相当重要的一环。在此推荐 Christoph Molnar 的非常棒的电子书 可解释的机器学习(Interpretable Machine Learning),颇为系统全面地介绍了许多前沿的模型解释可视化方法,涵盖了传统机器学习及深度学习领域,是这个方向很不错的导引材料。

    此外,在跟领域专家的合作过程中,还有一点小小的心得:虽然使用的往往都是常见的图表形式,但是在学术领域当中,许多图表有它们特定的一些习惯或规范;例如混淆矩阵(Confusion Matrix)通常以热力图的形式呈现,但并不是任意样式的热力图,什么数据放哪个轴,轴上文字以及图例的摆放等都有讲究,因此不妨参考学术文章中图表的形式,从而在降低数据及模型的理解门槛的同时,保持专业性与贴近有专业背景的读者的习惯。


    选自学术论文的混淆矩阵
    关键词二:个性化/私人化

    2019年是传说中“数据可视化成为主流”的一年(yayyy!),也是数据可视化越来越接地气、个性化和生活化的一年。其中不乏有趣的“100天的数据可视化漫画”项目,以及越来越多平台推出的个人数据的可视化,个人最喜欢的是豆瓣 App 的书影音档案可视化(可能是 Github style 引起程序员高度舒适哈哈),在移动端小小的屏幕空间中,清晰地展示了电影、书籍和音乐的记录日期和频率高低等多维度的数据,高效传达数据的同时有利于提升用户添加记录、去“点亮”那一个个方格的积极性,从而提高用户的粘性。这就是可视化的魅力吧!

    豆瓣的书影音档案
    关键词三:可视化理论基础

    是的,可视化理论基础依然是我最感兴趣的方向之一。为什么呢?可能是因为“知其然”固然很棒,“知其所以然”常常更让人激动不已。这一年中,我又再一次惊叹于这话题(坑)的深与广,就拿可视化色彩理论来说,由于色彩相关的理论在漫长的历史发展过程中有许多不同体系和版本,而且交织着源于物理、感知等不同层面的影响,各种概念错综复杂,宛如一张越引越大的渔网。限于篇幅在此暂不展开,以后有机会再作单独分享,先给感兴趣的小伙伴推荐一门这方面的线上课程:Colors for Data Science A-Z: Data Visualization Color Theory,要付费但日常打折,概念讲解深入浅出,举例丰富而生动,是个人觉得挺实用,甚至有点令人惊艳的课程。

    说来惭愧,2019年立的 flag 早就倒了一地,但对可视化依然是充满热爱与敬畏,看到数据可视化社区的发展壮大甚是开心,希望2020年能多做一点微小的贡献吧。

    相关文章

      网友评论

        本文标题:我的 2019 年可视化回顾

        本文链接:https://www.haomeiwen.com/subject/ndsuactx.html