电商的搜索策略一般由中台own,但是由于业务特点和数据供给原因中台无法对各个业务全面细致理解,导致部分业务的搜索结果不佳,影响用户体验,如搜索引擎无法理解“封阳台”=“定制门窗”,“高低床”=“上下床”。为了提升用户体验,业务方需要帮助搜索引擎辅助理解业务,今天不谈算法,只谈业务方如何帮助中台理解业务。
搜索-顾名思义“搜”和“索”,“搜”是用户行为,“索”是搜索引擎根据对搜索关键词,搜索时间,搜索地点,搜索用户理解后检索目标结果的过程。“索”一般可以分为四个步骤:意图识别,召回,排序,展示。
考核搜索质量的指标为QV_CTR,即每次搜索后,用户对搜索结果的点击率;该指标可以拆解为召回率曝光率点击率,碰到问题一定是细化细化再细化。
召回率取决于系统对于用户搜索意图的理解和理解后是否能准确匹配出相关结果。
楼主在生活服务类网站,搜索一直以poi为基础,poi下面会有sku,case,review,person等。
一般可以把词根据类目和词性两个维度来分,类目为公司内部对sku/poi等的划分标准,词性如品类词,产品词,品牌词,翻词,地标词。不同维度的词搜索优化策略不一样。
品类词可以直接召回对应的品类列表,产品词比品类词范围要窄,需要召回对应的sku list,或者有此类sku的poi。
由于poi信息没有全量线上化,因此部分poi提供的服务,售卖的产品搜索引擎是无从知晓的。为了使得用户依然可以搜索到相关poi,业务进行了一系列信息供给策略。
品牌维度sku:平台从线上或者线下主动获取品牌sku信息,线上化,优点是信息量大,用户体验好,便于用户决策,缺点是需要花费大量力气维护skulist。
标签:为了降低获取信息的难度,商户的服务内容和商品更多以标签的形式接入。首先根据用户词确定标签类型,再通过线上和线下的方式采集,给poi打上标签,最后将标签通过索引的方式接入大搜,形成标签供给。关于线下采集方式一般分为两种:电话采集和众包采集。
上位词:由于用户搜索的词较为离散,长尾词较多,如“五人沙发”,通过标签无法采集这么细致的信息,因此根据用户搜索词和类目结构,需要将上位词告知大搜。避免无结果或者少结果出现时影响用户体验。具体表现为用户搜索“五人沙发”时,如果结果太少或者关联性太弱,直接改写为“沙发”的召回结果,但是前端交互时需要明确告知用户。
近义词:业务方有很多搜索词意思相同或者相近,搜索无法理解,如“封阳台”近义词为“定制门窗”,针对“定制门窗”召回结果较好,但是“封阳台”召回结果较差,此时就需要人工告知搜索引擎“封阳台”和“定制门窗”为近义词。
以上聊了业务方如何帮助平台召回业务的策略,接下来具体聊聊排序策略。排序的高低直接影响poi流量的获取,因此如何排序不仅仅用于满足用户的体验,还涉及平台流量策略。如新店提权,合作提权,满足某类条件的提权。
首先谈用户体验,最终决定用户是否会点击的,不仅仅是业务相关性,还包括商户服务质量,商户距离用户的距离,商户品牌知名度。服务质量可以通过UGC侧面反馈,如评论人数,星级等。距离用户多远的商户,用户更容易点击呢?或者说用户一般的选择的店铺距离自己多远呢?这个可以根据历史数据学习得到,如装修设计用户,一般会选择距离自己目前住宅10km之内的商户装修。在学习过程中需要去除极端值,考虑用户浏览场景和消费场景。如用户一般在周一至周五选择周六探店,用户选择的场景是工作中,而探店一般的出发起始点又是住宅,是推荐家附近的还是工作附近的poi,排序时需要额外考量。
其次平台需要依赖流量分发策略来达到自己的商业目的,如商业营收,商户赋能等。
展示层面需要关注结果解释,为什么要召回这个poi,召回后为什么这个poi要排在前面。包括告知用户商户质量好坏,以及价格是否在自己预期范围内。
搜索品牌词时最好的结果就是直接召回品牌商户列表,按照距离排序,因为用户目标已经很明确了,同一个品牌下poi提供的商品和服务也是相对同质化的,因此直接按照距离排序就可以满足用户的需求。也有一些特殊的情况存在,比如用户搜索空间集合,如卖场,此时也需要将卖场下的子poi做相关召回。
网友评论