有道是,不懂技术的专利代理师跟咸鱼有什么区别。。。
本系列旨在总结“办案”(听起来很牛逼的样子,其实就是码字)过程中涉及到的基础技术知识。由于大部分知识来源于其他专业人士的原创文章(当然是经过筛选的、比较通俗易懂的),在此就不复制粘贴了,一般会附上原文链接以表敬意,有需要时候翻看。主要以记录对自己有启发的知识点和框架性的知识结构为主,先写写看,后续再调整。
一、联邦学习概述
联邦学习系统构架 联邦学习的定义联邦学习基础介绍详见:https://blog.csdn.net/weixin_41125270/article/details/102627704 (联邦学习(Federated Learning)分类及架构设计,作者:有梦想的咸鱼~)
核心步骤:从不同数据拥有方中确定共有用户群体,对共有用户群体数据进行加密后训练。
引发的问题:
看起来是A公司和B公司各自用各自的数据训练模型A和模型B,最后再结合成组合模型么?那么,怎么组合的呢?最终A公司和B公司得到的可使用的模型是啥呢?
二、涉及到的几个与模型评价相关的概念:
1、模型区分度指标KS值(Kolmogorov-Smirnov)
ks值的直观理解:识别率(真阳率)- 误判率(假阳率)
就是需要模型更多的识别出好人,更少的将坏人认做好人!
具体详见:https://blog.csdn.net/zs15321583801/article/details/88217839 (模型区分度指标KS值,作者: 棒子皮蹦蹦床)
2、模型稳定度指标(population stability index ,PSI)
直观理解:由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。
具体参见:
1)https://www.cnblogs.com/Allen-rg/p/11512095.html(比较详细)
2)https://blog.csdn.net/guhongpiaoyi/article/details/79043531(有个直观的例子)
模型、数据分布稳定性 作者: 人工智能times
网友评论