在前面的文章中提到,联邦学习是一套将多方数据安全地联合起来进行建模的技术体系。显而易见的是,各参与方的数据覆盖程度对联邦学习的应用方式至关重要。根据具体情况的不同,大体可以分为一下3种场景:
1. 用户覆盖小,特征覆盖大:
图 1典型例子就是联邦学习的参与企业均属同一行业的情况(如地方性银行)。由于各参与企业业务相似度较大,因而从业务数据中提取出的特征也极为相似。在这种情况下,可以采用的建模方法是利用多方特征的交集作为特征,多方用户的并集作为样本。从结果上来看,通过联邦学习的应用,实现了样本规模的扩充。
2. 用户覆盖大,特征覆盖小:
图 2典型例子就是联邦学习的参与企业位同一地区,但分属不同行业的情况。由于参与企业的所在区域重叠,因而服务的用户重叠度通常也较高。在这种情况下,可以采用的建模方法是利用多方特征的并集作为特征,多方用户的交集作为样本。从结果上来看,通过联邦学习的应用,实现了特征规模的扩充。
3. 用户覆盖小,且特征覆盖小:
图 3如果参与企业即非来自同一行业,又不位于同一地区,则属于此类场景。在该场景下,简单的联合方法显然无法奏效。然而在联邦学习中,对于此类场景有其独特的解决方法,即迁移学习。不难看出,此场景下的方案可以同样应用于前两种场景,具备极大的适用性,因而迁移学习是联邦学习的核心内容。关于迁移学习在联邦学习的应用,仍然在后续结合FATE项目进行探讨。
网友评论