搜索引擎原理:
抓取-匹配-排序。根据用户输入的关键词所体现的需求和网页的优劣进行评分,并根据最终分数进行排列展现。
搜索行业:
- [x] 搜索公司和产品:谷歌,百度,360,搜狗(被腾讯收购了),夸克(阿里旗下),头条
- [x] 夸克app:主打智能搜索。扫描提取文字,搜题,网盘,无广告。
- [x] 字节做头条+抖音+悟空搜索(主打无广告)
- [x] 而字节跳动做端内搜索,是为了在抖音、今日头条内建立可索引的内容体系,并最大限度地压榨内容的剩余价值。而做悟空搜索这类接近百度搜索的传统搜索引擎,则是出于互联网企业的“宿命”。
事实上,广告是搜索引擎最为重要的盈利方式,同时也是导致了搜索体验下降的罪魁祸首。
背靠字节跳动的悟空搜索现阶段显然不存在太多盈利的压力,但它可以不挣钱、却赚取流量。如果悟空搜索真能做起来,或将起到串联起字节跳动旗下各大平台内容,以及补全用户通过搜索触达内容的能力。在字节跳动向电商、直播、本地生活服务等赛道扩张之时,搜索引擎就可以起到放大器的作用。
- [x] 个人认为头条的机会:做智能搜索和无广告搜索,和抖音短视频、头条资讯文章、微头条、头条百科等各平台内容串联起来,引流到优质内容,创建搜索生态和好的搜索体验,再转化到电商等营收
关于搜索运营,我的思路:
- [ ] 整体思路:用户运营,优化用户体验,数据分析,优化策略。
先要明确搜索运营的目标是什么,然后进行用户信息和行为的采集和分析,给用户打标签,绘制用户画像,用户分层分类,分析他们会喜欢什么,想要搜出什么,目标出的内容是否符合,给文章和视频内容也抓取和打标签,做设计匹配规则策略,设计行为变量指标和策略效果评价指标。
- [x] 指定匹配策略:其实最好的办法是给用户和视频内容一起打标签,并进行对应。制作用户画像,用户分层,用不同的策略,比如两个人,一个标签儿是男,八零后,一个标签儿是女,九零后,然后对于不同类型的标签儿用户群用不同的推荐策略。同时,对于视频或文章内容也贴标签,就是这个内容,包含哪些关键词,它对应的哪些人群,他可能比如说对应九零后女群体,或者历史行为数据记录证明,90女群体搜索它并点进去浏览的比较多,然后两边儿标签儿来匹配,然后再设计计算匹配分儿,匹配分儿越高的,就给你展示的这个排名就越靠前。
- [x] 转化率就可以比如是 用户点击数/用户搜索数
- [x] 定策略方法:看数据分析,做假设,控制变量或ab test实验验证。
- [x] 1、先充分了解你的用户,构建用户画像和给用户贴标签:基础信息数据+行为数据+需求数据。
用户画像标签变量:
基础信息数据:性别,年龄,城市,职业,受教育程度,婚恋状况,星座等。
行为变量可能有:常用的搜索位置,搜索方式,热点搜索关键词,搜索后内容点开率,完播率,停留时间,退出百分比,点赞,收藏,转发,评论,截图等。对应不同视频分类下的不同表现,看什么分类下什么行为最活跃,对于给出的搜索内容的点开率和完播率高不高。
- [x] 2、对视频或文章内容打标签(比如抓取小标题和内容里出现次数多的关键词),分析内容标签和用户分类的对应情况,计算匹配度,方便提升搜索精准度和方便度。
- [x] 3、策略上线后的效果评价指标:直接从数据上想的就是,比如说迭代一版搜索策略之后,比如说我作为一个用户在抖音里边儿搜索一个关键词,然后我看了视频给我推荐的视频的话,如果我都是一划而过的,证明这个推荐策略不好,如果是我搜索完之后给我推荐出来之后,我搜索结果大多数时候都能点进去,都能停留挺长时间都能看完,然后甚至于能点赞收藏,评论转发的话,那就推荐结果就好了,用这些指标儿来衡量。
- [x] 比如可以定一个评价指标,类似点击响应率,就是一段时间内,搜索结果前5条有点击进去的次数/搜索的总次数,它肯定底层都对应不同的推荐策略,看看什么策略下这个点击响应率会提高。
这个5是定成5还是几,可以拉全体用户分布看一下,大部分是第几条的时候会点进去,还是直接就再次搜索别的去了。或者看经验来定。
多做几组对照实验组的,通过ab test,用不同的策略测试。也分析看看什么维度可能对点击响应率有效果。
比如说,拉取几个关键字?是先展示热门的视频还是先展示最关键字相关的视频?
看看这种变量的增减变化 对响应率有没有影响。
不过还涉及到一个问题,响应与不响应用户怎么定义。点击1次就算,还是点击率大于多少才算,或者看前五条点击进去几条。
具体怎么定义,这个还是看最终目的是什么。就是为了点击就行,还是为了什么其他产出。
因为一个用户下面会有多条行为日志。
这个也要定义清楚,才可以建模看变量。
看看是否还要求停留时长和完播率,如果单纯就要点击多,那建议就是点击率>一定比率的就算响应用户和成功策略。
(具体百分之多少,可以拉全体用户的情况看看分布先,0%的占多少 50%的多少 75%的多少 100%的多少。
如果都集中在50%,那就可以选50%作为响应用户,可以拿到更多的正样本。)
评价指标 看整体的就好了。
如果要优化策略,那就先定好目标用户,才能知道你建模是为了抓什么人 这时候就要给用户分成响应和不响应两种,分析他们的行为差异。
- [ ] 然后看看用户都去点哪些内容了,有什么关键词和内容特征,跟搜索词联系起来,慢慢找些可优化的指标和策略,让搜索结果和展示顺序更精准,用户更想看的展示在前面,优化迭代几版本,通过灰度发布,ab test,看数据。
- [ ] ABTest:假设检验法。设计两个|多个组——A/B | A/B/N,版本/策略不同,每个方案只有一个变量不同
同一时间维度,让组成成分相同(相似)的访客群组随机访问
收集用户体验数据和业务数据,使用假设检验方法评估,采用最好版本。
要保证分配机制随机和稳定性假设。
抽样方法,可以:分层抽样,各层采用不同比例抽样。
然后先AA空跑一下,看看是否差异不大,再AAB测试,AB实验组,AA对照组。
4、其他改进建议:
- [x] 优化用户体验,优化排版展示方式,加强用户行为引导,排版合理,版式美观,重点突出,易于阅读和找到有用的内容,广告不抢占主要内容的位置
- [x] 增加内容搜索:抖音搜索现在只能搜索视频标题和标签,没法搜索视频内容,要是能通过关键词搜索视频内容那就最好了,有些人看了视频没点赞划过去了,等再想找却找不到了,他可能不记得标题,但肯定会对里边的内容还是记得的,要是能搜索里边内容就更好了。
我觉得这个不只是对视频,对头条里的文章、问答也都可以。
可以对每个视频里面的内容(比如小标题、出现多的词)抓取几个内容关键词,给内容打上标签。
或者可以设置个3日内浏览过的列表。
- [ ] 细化功能完善,比如专门按音乐搜有合拍的,现在搜索合拍有时会出不能合拍的结果,不够精准
头条:
优点:
综合性强可搜索的内容分类多、全,甚至抖音的、西瓜视频的、b站等站外的内容等。
缺点或可优化点:
- [ ] 比抖音内容形式更多更全更杂,不只是短视频,还有文章,问答,微头条等。目前感觉内容太杂乱,可以分大类整合下。
- [x] 可学百度增加图片搜索功能,应该很多人有需求。
- [x] 增加智能搜索和语音搜索功能。
智能搜索、语音搜索是未来的必然趋势。
除了提供基本搜索功能,智能搜索还能提供用户兴趣自动识别、内容语义理解、信息过滤和推送等功能,具备知识处理能力和理解能力,能够把信息检索从目前基于关键词层面提高到基于知识和概念层面。搜索结果也更加人性化、更贴近用户需求,响应速度更快、搜索效率更高,注重提供知识和服务,呈现出智能化、个性化、场景化、多元化、协作性和交互便捷化的发展趋势。
- [x] 推荐栏目下,可以不只推荐热门新闻,也按历史搜索记录进行相关推荐,不然就和热榜重复了。推荐栏目下的搜索可以更精准,可以根据历史搜索词和上一次搜索词推荐相关热门词条。
- [x] 同一个账号,在app里调整了首页搜索分类的类别显示和排列顺序,但没有同步到pc端,pc端也没有找到选择和排序的地方。
- [x] Pc端头条热榜换一换后,无法返回第一页,最好做个分页。
- [ ] 增加分类定向搜索:分类定向搜索功能不够,只能搜问答等,无法定向搜文章等形式,最好搜索里再细分更全的内容形式分类。且头条下缺少一些搜索内容类别,比如教程。
另外为什么在底部视频分类里搜索,不能直接先出视频类的内容,而是依然到了综合里。
前几条搜索内容里会有几个重复的广告。
- [ ] 搜索精准度可以做技术优化:
提升关键词语言识别技术。我用百度搜索 再进知乎 都比直接搜知乎 答案更准确。说明百度这方面关键词和内容匹配技术做得更好。
头条和抖音的区别:
- [ ] 头条的内容分类更多。比抖音多网页,咨询热点,问答,小说,娱乐,懂车帝等很多栏目。
- [ ] 头条融合了抖音,西瓜视频,b站等站外资源的链接,可以跳转到去抖音搜,去西瓜搜。
- [ ] 抖音出现前几条的是相关用户推荐和话题推荐,而头条先是相关影视剧,百科,网页,资讯,更类似百度的功能
- [ ] 抖音多个扫一扫抖音码和图片的功能
搜索行业,公司位置:
搜索行业巨头:百度、搜狗、头条(在第一梯队,但主要是资讯新闻的感觉,大家对其搜索的认知不够)。
在市场份额方面,截至今年6月,百度在移动端与桌面端均占据第一的位置,分别占据45%和93%,在移动端,搜狗占据32%,而头条搜索被列入到占据1%以下的“其他搜索”之列。
据百度年报,百度占据国内搜索引擎第一位置,2020年来自搜索板块的在线营销收入仅增加了5%,原因之一是视频和电商广告份额的增长,搜索广告占比遭到进一步挤压。
我认为想打出一片天,需要有独特的内容优势和特点,吸引用户进驻,进来搜索内容,体验搜索,和优化搜索技术和推荐策略,给用户更好的体验。
产品设计需求分析思路:
- [ ] 给谁,做什么事,要达到什么效果,需要什么功能。
搜索指标:
- [ ] DCG的英文全称是Discounted cumulative gain,它是一个衡量搜索引擎算法的指标。
搜索引擎一般采用PI(per item)的方式进行评测,简单地说就是逐条对搜索结果进行分等级的打分。假设我们在Google上搜索一个词,然后得到5个结果。我们对这些结果进行3个等级的区分:Good(好)、Fair(一般)、Bad(差),然后赋予他们分值分别为3、2、1,假定通过逐条打分后,得到这5个结果的分值分别为3、2 、1 、3、 2。
线上问题解决思路:
- [ ] 定位原因:客群波动+技术原因。
要不然人变了 要不然自己的需求底层涉及到的哪个环节出错了。进来的人变了呗 就是你各环节排查没问题了 那就只能是人变了。你要运营 业务指标,就看看是不是开放了什么新入口 新注册进来的用户和之前行为完全不同
- [ ] 你要是做这块 肯定也是差不多的,所以去了新岗位 第一时间要先清楚底层交互逻辑 谁在哪一环 谁会影响你的指标。一般只知道上下游 就差不多了。
因为你除了定位自己相关的问题 可能还要用你的经验指导这个环节的开发去找上一环节开发的问题。
产品增长思路:
- [x] 小而精,把最活跃的功能做到体验更好,才是核心竞争力
运营思路:
- [x] 分析数据,看看用户流失的地方主要在哪,比如是图片没设置好吗,然后做假设,快速多次尝试,固定其他变量去实验对比验证,ab test,在某些地区或客户群先改变验证,要有对照组一半改一半不改,再分析数据结果
- [x] 可以换不同的页面logo广告语尝试,多实验验证,比如做相亲,广告语换成帮助朋友找对象,可能比自己找对象,更火。(改广告语验证很快捷低成本)
- [x] 分析关键数据,找到北极星指标,和产品定位,比如twitter的用户间关注回关率如果高,是社交属性,低,是媒体属性
- [x] 留存转化率优化:
- [ ] 留存:欲望-摩擦
- [x] 设计流失时的问卷调查,有的人会喜欢这会发个牢骚
优化新用户体验:单点登录。
翻转漏斗:先让用户试听一阵子,比如7天免费体验。
积极的摩擦:填写基本信息后能减少后续筛选过程的
- [x] 用户搜索产品经理会全身心关注用户体验,除了关注内容相关性、搜索结果质量等基本特性外,还要投入很大精力探索更多新的机制和展现效果,例如“阿拉丁”、“轻应用”等,其终极目标仍然在于提升用户满意度以提升用户使用量和活跃度,最终提升整体流量。
抖音:
用户定位:
- [x] 一二线城市的年轻人居多
- [x] 需求:想分享生活,社交互动,休闲放松,猎奇需求的
- [ ] 抖音用户活跃时间有两个高峰期:中午饭点12-13和晚上休息娱乐段19-21
内容定位:
- [x] 短小、有趣、悠闲放松为主、获取新闻和知识为辅
商业运营模式定位:
- [x] 综合性,融合了娱乐分享、社交互动、广告、电商。信息流短视频+算法推荐,⽅便进⾏⼴告变现;同时抖⾳还具有很强的“带货”特性,⽅便平台进⾏电商商业化探索。
好:
综合全面多元:
- [x] 综合性,融合了娱乐分享、社交互动、电商,还能实现社交和群聊
- [x] 内容和形式多元,短视频,直播,音乐,各类内容
- [ ] 可以用户自产内容自传播ugc
- [ ] 加好友方式多样:通讯录,抖音号,二维码
电商:
- [x] 不用直播,短视频就可以直接带动电商带货,直观,吸引力强
分类易用:
- [x] 关注的人可以分类分组
- [x] 上传的内容可以分合集
不好:
- [x] 低门槛可能会有低俗劣质内容,加强审核监管,开发针对于低俗内容、敏感话题等的自动检测机制
- [x] 电商的评价、买家秀、售后保障需要进一步完善,让客户放心
格式形式可扩充:
- [ ] 不支持图文形式
- [ ] 对长视频和知识类科普的支持不够
- [x] 对普通人自媒体账号的流量支持不够,一阵子没更新就容易沦为僵尸号,再难起来。可能流失自媒体作者。
- [x] 抖音电商的优势:最新的iphone14产品和资讯,下面再跟几个开箱实测视频。官方广告 应该带几个开箱视频,抖音的定位就是为了看用户或者大V发的视频的。如果就为了看官方链接官方广告 肯定正常都优先看京东天猫或者苹果官网啊。大V的推荐 可能比官方更有说服力,对抖音场景来说。先出大V评测视频,带动引出官方电商广告更好。
针对不同类的内容用不同的展示形式,比如开箱实测评测用视频,资讯有文字网页。
不同用户群体不同策略。
网友评论