Algorithm:
-
detailed:
1、基于hit rate,认为hit rate(用d表示) 与x存在某种线性关系,表示为
其中,x为文件f在时间t之前能在边缘节点n查到; sita表示未知的参数变量。
2、Problem Formulation
进一步,将max转化为min
有
称R(T)为long-term regret
3、针对上述问题,用岭回归提出算法
- Learner predict model
1、
-
Ridge regression
啧啧,机器学习,口亨
因为岭回归属于线性回归,直接搬砖部分线性回归。。。
https://zhuanlan.zhihu.com/p/30422174
https://zhuanlan.zhihu.com/p/22064801
回归是对连续数据进行预测
1、无偏差标准线性回归和有偏局部加权线性回归
1)、标准线性回归
给定一组数据的特征向量和目标变量
分别可以用最小二乘法和投影矩阵获取回归系数
获取w后,需要判断模型预测能力的好坏。即计算模型得到的y值的向量与实际y值向量的匹配程度,即相关系数的计算correlation coefficient。
协方差便是衡量两个变量变化趋势是否相似的一种方法
2)、局部加权线性回归
对每个样本值都要计算高斯核权值,因此算法代价较大。
2、岭回归和LASSO
实际就是最小二乘法,只不过通过添加限制项来处理奇异矩阵
1)、中心化和标准化
将数据的均值调整到0,标准差调整为1, 计算过程很简单就是将所有数据减去平均值后再除以标准差:
中心化其实就是个平移过程,将所有数据的中心平移到原点。而标准化则是使得所有数据的不同特征都有相同的尺度Scale, 这样在使用梯度下降法以及其他方法优化的时候不同特征参数的影响程度就会一致了。
在标准最小二乘优化添加惩罚项
论文中相对应地
进一步地,
文章通过限定误差,获取最优的hit rate。论文算法基本结束,后面论文又进行的regret analysis,即计算R(T)的复杂度。待续吧。。。(先TM把周报写完。)
2). LASSO
与岭回归基本相同,只不过将岭回归的惩罚项w^2,变为|w|.细节不讲。
- perturbation term
- Euclidean norm
-
CDN中的相关特性:
1、缓存内容
缓存html、图片、css、xml等静态资源。
2、缓存内容更新
由源站apache的expire和header决定
3、缓存内容的更新
a)、用户首次请求,cdn从源站抓取后缓存,知道文件过期后有用户请求再次更新;
b)、程序主动通知cdn抓取
4、更新频率
根据访问量及访问行为自动的设定更新频率,也可以在后台根据网站不同的栏目设定灵活多样的缓存策略和主、被动的数据更新方式;并进行智能调控和缓存。
参考链接http://blog.csdn.net/wangxin1982314/article/details/51050267
网友评论