直通车选词,现在系统中分为2种:
- 自动优化选词
用户托管的宝贝会使用这种选词。现在只是用了淘宝 Api 推荐的关键词。(因为我们系统推荐的词又很多不合适,甚至词意差很多的词) - 手动选词
根据不同的维度推荐关键词。用户自己选择合适的词添加。
下面说的选词算法也主要是手动选词。
手动选词
-
输入商品链接或id
选择商品.png
2.获取商品信息
-
获取核心词
- 商品标题+商品分类+商品属性(会去掉一些无用的属性)拼接成一个 大的字符串
- 使用词性标注Api对字符串进行分词,获取有用的信息
分词结果主要包含:品类, 品牌, 颜色, 品类修饰词, 修饰, 款式元素, 功能功效, 文娱书文曲, 人群, 风格, 场景, 游戏名称, 影视名称, 营销服务, 新词, 材质, 地点地域等。 - 将分词后的词重新分组。
分为:产品词,品牌词,属性词 -
生成 2 个创意标题。
获取核心词.png
-
开始选词
综合词
词数:0-200
来源:词库
算法:
-
a. 从属性信息中挑出属性值
休闲,黑色,春季,字母,青年
-
b. 然后从 属性指表(taobao_item_value) 中查询出属性id数组
cid为分类id,从第2步中 获取商品信息 中已获得
SELECT vid FROM `taobao_item_value` WHERE cid=1 AND ( name ='休闲' OR name='黑色' OR name='春季' OR name='字母' OR name='青年');
属性id数组:vid_arr=[1,2,3]
-
c. 将属性id 2 个2个组合,生产查询条件
$attrib_arr = ['1,2', '1,3', '2,3']
属性查询条件 :$attrib_where= "attrib_list='1,2' OR attrib_list='1,3' OR attrib_list='2,3' "
-
d. 获取品牌id,默认值 0
品牌pid固定值:20000
SELECT vid FROM `taobao_item_value` WHERE cid=1 AND pid=20000 AND name='李宁';
品牌查询条件
brand_id !=0:$brank_where=“ (brand_id = 111 OR brank_id=0) ”
brand_id ==0:$brank_where=“ (brank_id=0) ”
-
e. 获取品牌id,默认值 0
keyword_attrib_only 关键词属性标记表
keyword_report_all 关键词报表SELECT n.title as word,a.brand_id,a.attrib_list,a.score,r.impression,r.click,r.ctr,r.cpc,r.coverage,r.competition FROM `keyword_attrib_only` a LEFT JOIN `keyword_name` n ON a.keyword_id=n.id LEFT JOIN `keyword_report_all` r ON a.keyword_id=r.id WHERE a.taobao_category_id='1' WHERE (brand_id = '111' OR brand_id='0') AND (a.attrib_list='1,2' OR a.attrib_list='1,3' OR a.attrib_list='2,3' ) LIMIT 5000;
1. 过滤黑名单词
2. 过滤报表数据相同的相似词
3. 获取结果
如果关键词个数 >= 200,返回结果;
如果关键词个数 < 200,将属性id 1 个1个组合,即attrib_list='1' OR attrib_list='2' OR attrib_list='3',重复步骤 c,d,e
如果关键词个数仍然 < 200,获取attrib_list=''的关键词,重复步骤 c,d,e
优选词
词数:0-200
来源:词库
算法:
-
a. 将核心词( 产品词,品牌词,属性词)组合生产关键词
组合方式:
1个产品词 + 2个属性词
1个品牌词+1个产品词+2个属性词
-
b. 通过淘宝Api获取关键词报表
长尾词
词数:0-200
来源:词库
算法: -
a. 将核心词( 产品词,品牌词,属性词)组合生产关键词
组合方式:
1个产品词 + 3个属性词
1个品牌词+1个产品词+3个属性词
- b. 通过淘宝Api获取关键词报表
类目词
词数:0-2000
来源:词库
算法:
与 综合词 最后一步一样。
直接获取 cid=1 AND attrib_list=‘’ 的关键词
精准淘词
词数:0~n
来源:词库
算法:
-
a. 用户输入词汇,或 选择核心词(一次最多输入3个词)
-
b. 获取商品对应类目下的关键词
使用了迅搜(帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎)
-
c. 返回去除报表数据相似的关键词
主要数据表
关键词表(主表)
- 表名
keyword_name - 数据量
101459388 - 表结构
Field | Type | Null | Key | Default | Extra | Content |
---|---|---|---|---|---|---|
id | bigint(20) unsigned | NO | PRI | NULL | id | |
title | varchar(50) | NO | NULL | 关键词名称 |
关关键词属性标记表
- 表名
keyword_attrib_only - 数据量
35054404 - 表结构
Field | Type | Null | Key | Default | Extra | Content |
---|---|---|---|---|---|---|
id | bigint(20) | NO | PRI | NULL | auto_increment | id |
keyword_id | bigint(20) | NO | MUL | NULL | 关键词id | |
taobao_category_id | bigint(20) | NO | MUL | NULL | 分类id | |
brand_id | bigint(20) | NO | NULL | 品牌id | ||
attrib_list | varchar(200) | NO | NULL | 属性标记 | ||
score | float(10,4) | NO | NULL | 类目相关度得分 |
关关键报表
- 表名
keyword_report_all - 数据量
101293616 - 表结构
Field | Type | Null | Key | Default | Extra | Content |
---|---|---|---|---|---|---|
id | bigint(20) unsigned | NO | PRI | NULL | auto_increment | id |
is_empty | enum('Y','N') | NO | MUL | Y | 是否为空 | |
get_date | date | NO | NULL | 获取日期 | ||
impression | int(10) unsigned | NO | NULL | 展现量 | ||
click | int(10) unsigned | NO | NULL | 点击量 | ||
cost | int(10) unsigned | NO | NULL | 花费 | ||
directtransaction | int(10) unsigned | NO | NULL | |||
indirecttransaction | int(10) unsigned | NO | NULL | |||
directtransactionshipping | int(10) unsigned | NO | NULL | |||
indirecttransactionshipping | int(10) unsigned | NO | NULL | |||
favitemtotal | int(10) unsigned | NO | NULL | |||
favshoptotal | int(10) unsigned | NO | NULL | |||
transactionshippingtotal | int(10) unsigned | NO | NULL | |||
transactiontotal | int(10) unsigned | NO | NULL | |||
favtotal | int(10) unsigned | NO | NULL | |||
competition | int(10) unsigned | NO | NULL | |||
ctr | float(6,2) | NO | NULL | |||
cpc | float(6,2) | NO | NULL | |||
roi | float(6,2) | NO | NULL | |||
coverage | float(6,2) | NO | NULL |
淘宝属性值表
- 表名
taobao_item_value - 数据量
8563521 - 表结构
Field | Type | Null | Key | Default | Extra | Content |
---|---|---|---|---|---|---|
cid | int(11) | NO | PRI | NULL | 分类cid | |
pid | int(11) | NO | PRI | NULL | 父id | |
vid | int(11) | NO | PRI | NULL | 属性值id | |
name | varchar(150) | NO | NULL | 属性名 |
网友评论