无论什么类型的机器学习问题,都包括以下组件:
用来学习的数据(data)
用来转换数据的模型(model)
用来量化模型有效性的目标函数(objective function)
用以调整模型参数以优化目标函数的算法(algorithm)
每个数据集由一个个样本(example, sample)组成,
大多时候,它们遵循独立同分布(independently and identically distributed, i.i.d.)。样本有时也叫做数据点 (data point)或者数据实例(data instance),通常每个样本由一组称为特征(features,或协变量(covariates) 的属性组成。
网友评论