一、从《小白如何快速进阶今日头条》学到的三点: 听完了妖胖儿老师讲的《小白如何快速进阶今日头条》,对于正在学习写作...
由于最近岗位调动的关系,工作职责从业务类转为人事行政类,负责一家互联网中型企业的综合部工作。在人事行政领域,我虽然...
一、初相识 第一次听到“运营”这个词已不记得是什么时候,只是通过不断的搜寻查阅发现:在这个互联网飞速发展的时代,...
周颖老师分享的《科学学习》告诉我们如何从小白快速进阶为高手? 初学者:观察学习,参照案例进阶者:精修勤练,选择合适...
零基础从小白开始,从基础代码到进阶,开启你的R语言学习之路。
――职场小白进阶之心路历程史 (补昨天)今天是没有效率的一天。 早上定的小目标没有完成,上午下载了Python和p...
这是楼主学习在windows下搭建深度学习环境的心(作)路(死)历程,本着no zuo no die 的精神,小白...
零基础小白手绘进阶
首先恭喜小伙伴们经过前面7节小白课程成功摆脱区块链小白称号,开启进阶课程! 区块链小白进阶币读:币圈技术 区块链技...
本文标题:小白进阶历程-直方图学习
本文链接:https://www.haomeiwen.com/subject/efoagttx.html
网友评论
不过我有一点疑问,为什么你觉得,直方图光滑没有锯齿就是好的呢!也许数据本身就是在某个地方,有一个奇异值呢?
另外,可以想一想,能否根据样本总量,估算一个大概合适的bins数值?
关于bin size 的选择,可参考 Freedman–Diaconis Rule
(1)不是说直方图光滑没有锯齿就是好,这个好也是相对的。直方图出现锯齿情况,因为直方图每一个柱表示的是落入该区间内的数据的个数(或频率),即意味着相邻区间落入数据的个数差异比较大(对于我观测整个数据的分布来说不好,但如果你要细看在每个区间上的数据分布,当然细分组数多了较好),但并不意味着该数为奇异值。ps.这时候如果我稍微将区间扩大一些(即减小组数),就可以将消除这种现象。
(2)因为直方图主要是用来观测数据集的整体分布,直方图属于数据可视化,即在数据可视化之前,应该对数据已经预处理了,所以奇异值在绘直方图之前应该已经被处理了(当然这两个数据集我并没有进行数据预处理)。
(3)如果数据集中有奇异值,并且没有在预处理时被剔除,因为奇异值在整个数据集中是与众不同的,所以该值相对于大部分数据来说一般不是过于大就是过于小,不管是值过大还是过小,都只会出现在直方图两侧,不会在中间出现,而锯齿是直方图中间部分出现柱忽高忽低的情况,所以这两者我觉得没有一定的关系。
关于第二个问题,目前直方图组数是根据数据量大小给一个范围,一般分为5-20组,具体组数没有固定的。这也是一个好问题,不过我目前没有想到合适的方法😂。
这都是我的见解,有不对的地方还请见谅,欢迎随时交流😊