离散值

作者: 全栈小哥 | 来源:发表于2017-07-04 21:16 被阅读0次

机器学习领域开发的分类算法通常把属性分成离散的或连续的。每种类型都可以用不同的方法处理。离散属性具有有限或无限可数个值,可以用或不用整数表示。属性hair_color、smoker、medical_test和drink_size都有有限个值,因此是离散的。注意,离散属性可以具有数值值。如对于二元属性取0和1,对于年龄属性取0到110。如果一个属性可能的值集合是无限的,但是可以建立一个与自然数的一一对应,则这个属性是无限可数的。例如,属性customer_ID是无限可数的。顾客数量是无限增长的,但事实上实际的值集合是可数的(可以建立这些值与整数集合的一一对应)。邮政编码是另一个例子。

如果属性不是离散的,则它是连续的。在文献中,术语“数值属性”与“连续属性”通常可以互换地使用。(这可能令人困惑,因为在经典意义下,连续值是实数,而数值值可以是整数或实数。)在实践中,实数值用有限位数字表示。连续属性一般用浮点变量表示。

相关文章

  • 离散值

    机器学习领域开发的分类算法通常把属性分成离散的或连续的。每种类型都可以用不同的方法处理。离散属性具有有限或无限可数...

  • 台大数位语音处理第四课part2

    信号离散化:连续值变离散值。离散值用01组成的比特表示整数。分成N块,并从一块中选一个点的值代表这一块。 平均分不...

  • 【统计】基础理论

    标准差数据值越大,说明越离散,数据值越小,说明越聚拢;

  • 索引的相关知识补充

    列的离散型: COUNT(DISTINCT col):count值越大,离散型越好,则选择性越好,被索引使用的可能...

  • 偏差与方差

    偏差(bias)——预测值期望与真实label的误差。 方差(variance)——预测值的离散程度,即预测值离期...

  • 连续值特征的离散化

    背景 LR模型中,更偏向于对离散化特征进行训练,对于连续值特征,更多的情况下是将连续值特征离散化,再加入模型进行训...

  • 插值

    离散数学近似值 //Linearly interpolates between two vectorsVector...

  • python replace

    修改 替换某些值编码可以参考python处理excel离散数值编码

  • Pandas数据分析-数据整理data wrangling, s

    (2022.05.16 Mon) 数据分箱 分箱指的是将连续值转化为离散值的过程,Pandas指令有cut,qcu...

  • 机器学习中的特征工程(四)---- 特征离散化处理方法

    简介 特征离散化指的是将连续特征划分离散的过程:将原始定量特征的一个区间一一映射到单一的值。离散化过程也被表述成分...

网友评论

      本文标题:离散值

      本文链接:https://www.haomeiwen.com/subject/dwoxhxtx.html