案例分享 | 魅族推荐平台架构

作者: IT大咖说 | 来源:发表于2018-05-29 11:48 被阅读2次

案例分享 | 魅族推荐平台架构
魅族大数据运维平台实践
魅族大数据运维平台实践
魅族大数据运维平台实践
双摄见得多了？试试魅族PRO 7的惊艳双眸
TOP100summit 2017：【案例分享】魅族持续交付平台
倪江利：魅族推荐平台的架构演进之路
魅族MX3的设计问题
魅族大数据之用户洞察平台
比PRO7还惨？魅族15“身份证”照现身，网友褒贬不一

内容来源：2017年4月8日，倪江利在“七牛架构师实践日-大数据技术最佳实践”进行《魅族推荐平台架构》演讲分享。IT大咖说（id：itdakashuo）作为独家视频合作方，经主办方和讲者审阅授权发布。

阅读字数：2889 | 5分钟阅读

嘉宾演讲视频回放及PPT：http://suo.im/4X5VvN

摘要

魅族是一家智能手机研发公司，也是一家互联网公司，拥有超大规模的用户量及海量数据量，魅族推荐平台实现了在海量的数据中对算法模型进行在线及离线训练，在高并发的场景下实时进行预测为用户推荐更感兴趣的信息。同时支撑多算法组合A/B测试，以供算法进行在线实验，并能在线进行动态机器资源分配以达到资源的最大化利用。

在线模块——OpenAPI

统一接入规范：所有应用接入按照统一规范进行接入，所有提供出去的接口模式统一，这样大大降低接入方的难度。

路由：根据用户标识、版本、服务器IP以及权重规则路由到不同的Online计算插件服务。这样一来可以实现流量分流、A/B Test、灰度发布的目的、接口代理。

接入权限管理：统一管理接口调用权限。

统一监控：统一进行业务设用监控，如业务调用量、QPS、响应时长、业务设用失败告警等。

A/B测试模块

在推荐平台中最重要的一个功能就是A/B测试，A/B测试主要是对用户进行抽样分流道不同的算法组合当中，最后通过评估数据来驱动算法工程师对算法效果不断的进行调优。

A/B测试效果评估过程

用户请求数据后，APP端及Web端对用户看到的推荐数据所产生的一系列行为进行上报，数据采集服务端对日志数据进行收集并通过流平台将数据进行归并，同时对部分的实时数据进行在线统计分析，最终产生效果评估数据。

在线模块——计算模块

业务策略计算主要是处理业务相关的一些排序、过滤、人工干预竞价排名等与具体业务相关的逻辑，不同的业务各性化需求采用插件化的方式进行接入。

初始化模块主要处理算法模型的管理（模型加载、卸载，存储等等）、模型计算。

推荐一般性的数据处理过程从召回阶段到预测再到业务重排阶段，数据量依次减少。

精选阶段的数据是来源于召回的数据，有可能同时存在几个或者十几个召回算法，对不同召回的数据及相关的资源可能存储在不同的机器上或数据库中，所以请求接收点结在接收请求后，需要根据配置将不同的处理请求分发到不同的机器上进行计算，然后再归并返回。

近线模块

该层主要是利用流式处理的技术对用户实时产生的行为日志进行加工，利用一些高效、高性能的算法生产有价值的数据，如处理算法数据召回、实时数据统计等等。

资源管理调度

机器动态划分分组，可以按业务进行划分，也可以按照模型资源情况进行划分。

解决业务之间相互影响，按照业务对性能的要求及复杂度分配不同的硬件机器。同时能够整合资源，不同大小的配置都可以在集群中得到应用。

解决内存模型存储限制问题，将模型分散到不同的集群中进行横向扩展。

在请求过程中，请求根据master进行动态调度，大型资源加载过程中机器请求自动调度到其它机器，解决大型资源加载过程中对业务的影响。

在线模块——存储

在存储上多样性，不同类型的组合使用，根据不同的场景与性能指标采用不同的存储组合。

LocalCache：一般用来处理一次请求中访问数据频次超高但数据容量不需要太大的数据，如LR模型数据。

Mysql、Hbase、Redis：这三种存储的选择一般从性能和各自的特性出发点来选择是最合适的，各自都是集群的方式，Mysql可以按业务数据进行拆分成不同的集群进行访问。

离线——机器学习平台

提供特征工程、统计、训练、评估、预测和模型发布等功能，覆盖机器学习全流程，可以通过拖拽的方式完成模型训练和评估。

模型训练及评估界面化，与调度平台无缝集成，使得算法离线模型处理及模型发布上线等更加高效简单。

系统集成多种算法可进行逻辑回归LR、聚类Kmeans、模型LDA、协同过滤CF等多种模型训练。

进行分布式数据处理与计算。

监控告警

细粒度性能监控，可以细粒度到具体的业务请求接口，从业务QPS、PV量、响应时长等等；

应用服务器及操作系统各项指标监控；

业务指标监控，如算法效果及其它业务指标监控；

监控指标可根据具体的需求扩展。

魅族推荐平台挑战和愿景

挑战10亿/每天以上在线实时计算请求PV数；

支撑起百亿条/每天的日志进行实时计算，毫秒级别地进行用户模型更新；

支撑更多的特征集计算，同时在线计算响应时长更短；

支撑更多的魅族产品线业务；

推荐平台对外开放，能为行业其它的企业提供专业的推荐服务；

深度学习集成。

今天的分享到此结束，谢谢大家！

案例分享 | 魅族推荐平台架构
内容来源：2017年4月8日，倪江利在“七牛架构师实践日-大数据技术最佳实践”进行《魅族推荐平台架构》演讲分享。I...
魅族大数据运维平台实践
一、大数据平台介绍 1.1大数据平台架构演变如图所示魅族大数据平台架构演变历程： 2013年底，我们开始实践大数...
魅族大数据运维平台实践
一、大数据平台介绍 1.1大数据平台架构演变如图所示魅族大数据平台架构演变历程： 2013年底，我们开始实践大数...
魅族大数据运维平台实践
一、大数据平台介绍 1.1大数据平台架构演变如图所示魅族大数据平台架构演变历程： 2013年底，我们开始实践大数...
双摄见得多了？试试魅族PRO 7的惊艳双眸
双摄见得多了？试试魅族PRO 7的惊艳双眸魅族PRO 7系列旗舰手机是魅族架构调整后的首款产品，同时也是魅族第一...
TOP100summit 2017：【案例分享】魅族持续交付平台
本篇文章内容来自第10期魅族开放日魅族科技运维架构师古日旗的现场分享。编辑：Cynthia 一、自动化建设历程 ...
倪江利：魅族推荐平台的架构演进之路
摘要：魅族拥有超大规模的用户量及海量数据，魅族推荐平台实现了在海量的数据中对算法模型进行在线及离线训练，在高并发的...
魅族MX3的设计问题
以前我给人推荐Android手机，除了Nexus系列，国内的我只推荐魅族，但自从入手MX3后，我再也不推荐魅族了。...
魅族大数据之用户洞察平台
内容来源：2017年5月6日，魅族数据架构师黄振贤在“魅族技术开放日第八期——数据洞察”进行《魅族大数据之用户洞察...
比PRO7还惨？魅族15“身份证”照现身，网友褒贬不一
今儿聊聊魅族J.W早几个月爆料的魅族15周年纪念款手机“魅族15”。大家都知道，如今新机未发先而合法曝光的平台，就...

案例分享 | 魅族推荐平台架构

摘要

推荐介绍

推荐能做什么

推荐的作用

推荐在魅族中的应用

推荐效果

魅族推荐平台架构演进

推荐平台需要做的事

推荐平台第一代架构——存在的问题

推荐平台第二代架构——优势

推荐平台第二代架构——存在的问题

魅族推荐平台现状

三代架构的核心需求

推荐平台架构分层

在线模块——OpenAPI

A/B测试模块

A/B测试效果评估过程

在线模块——计算模块

近线模块

资源管理调度

在线模块——存储

离线——机器学习平台

进行分布式数据处理与计算。

监控告警

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读