美文网首页
直通车选词

直通车选词

作者: code_yaj | 来源:发表于2019-01-01 20:10 被阅读0次

    直通车选词,现在系统中分为2种:

    • 自动优化选词
      用户托管的宝贝会使用这种选词。现在只是用了淘宝 Api 推荐的关键词。(因为我们系统推荐的词又很多不合适,甚至词意差很多的词)
    • 手动选词
      根据不同的维度推荐关键词。用户自己选择合适的词添加。
      下面说的选词算法也主要是手动选词。

    手动选词

    1. 输入商品链接或id
      选择商品.png

    2.获取商品信息

    获取商品信息.png
    1. 获取核心词

      • 商品标题+商品分类+商品属性(会去掉一些无用的属性)拼接成一个 大的字符串
      • 使用词性标注Api对字符串进行分词,获取有用的信息
        分词结果主要包含:品类, 品牌, 颜色, 品类修饰词, 修饰, 款式元素, 功能功效, 文娱书文曲, 人群, 风格, 场景, 游戏名称, 影视名称, 营销服务, 新词, 材质, 地点地域等。
      • 将分词后的词重新分组。
        分为:产品词,品牌词,属性词
      • 生成 2 个创意标题。


        获取核心词.png
    2. 开始选词
      综合词
      词数:0-200
      来源:词库
      算法:

    • a. 从属性信息中挑出属性值

      休闲,黑色,春季,字母,青年

    • b. 然后从 属性指表(taobao_item_value) 中查询出属性id数组

      cid为分类id,从第2步中 获取商品信息 中已获得

        SELECT vid FROM `taobao_item_value` WHERE cid=1 AND ( name ='休闲' OR name='黑色' OR name='春季' OR name='字母' OR name='青年');
      

      属性id数组:vid_arr=[1,2,3]

    • c. 将属性id 2 个2个组合,生产查询条件

      $attrib_arr = ['1,2', '1,3', '2,3']

      属性查询条件 :$attrib_where= "attrib_list='1,2' OR attrib_list='1,3' OR attrib_list='2,3' "

    • d. 获取品牌id,默认值 0

      品牌pid固定值:20000

        SELECT vid FROM `taobao_item_value` WHERE cid=1 AND pid=20000 AND name='李宁';
      

      品牌查询条件

      brand_id !=0:$brank_where=“ (brand_id = 111 OR brank_id=0) ”
      brand_id ==0:$brank_where=“ (brank_id=0) ”

    • e. 获取品牌id,默认值 0

      keyword_attrib_only 关键词属性标记表

      keyword_report_all 关键词报表

       SELECT n.title as word,a.brand_id,a.attrib_list,a.score,r.impression,r.click,r.ctr,r.cpc,r.coverage,r.competition FROM `keyword_attrib_only` a
        LEFT JOIN `keyword_name` n ON a.keyword_id=n.id
        LEFT JOIN `keyword_report_all` r ON a.keyword_id=r.id
        WHERE a.taobao_category_id='1' WHERE (brand_id = '111' OR brand_id='0') AND (a.attrib_list='1,2' OR a.attrib_list='1,3'  OR a.attrib_list='2,3' ) LIMIT 5000;
      

      1. 过滤黑名单词
      2. 过滤报表数据相同的相似词
      3. 获取结果
      如果关键词个数 >= 200,返回结果;
      如果关键词个数 < 200,将属性id 1 个1个组合,即attrib_list='1' OR attrib_list='2' OR attrib_list='3',重复步骤 c,d,e
      如果关键词个数仍然 < 200,获取attrib_list=''的关键词,重复步骤 c,d,e

    优选词
    词数:0-200
    来源:词库
    算法:

    • a. 将核心词( 产品词,品牌词,属性词)组合生产关键词

      组合方式:
      1个产品词 + 2个属性词
      1个品牌词+1个产品词+2个属性词

    • b. 通过淘宝Api获取关键词报表
      长尾词
      词数:0-200
      来源:词库
      算法:

    • a. 将核心词( 产品词,品牌词,属性词)组合生产关键词

      组合方式:
      1个产品词 + 3个属性词
      1个品牌词+1个产品词+3个属性词

      • b. 通过淘宝Api获取关键词报表

    类目词
    词数:0-2000
    来源:词库
    算法:

    综合词 最后一步一样。

    直接获取 cid=1 AND attrib_list=‘’ 的关键词

    精准淘词
    词数:0~n
    来源:词库
    算法:

    • a. 用户输入词汇,或 选择核心词(一次最多输入3个词)

    • b. 获取商品对应类目下的关键词

      使用了迅搜(帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎)

    • c. 返回去除报表数据相似的关键词

    主要数据表

    关键词表(主表)

    • 表名
      keyword_name
    • 数据量
      101459388
    • 表结构
    Field Type Null Key Default Extra Content
    id bigint(20) unsigned NO PRI NULL id
    title varchar(50) NO NULL 关键词名称

    关关键词属性标记表

    • 表名
      keyword_attrib_only
    • 数据量
      35054404
    • 表结构
    Field Type Null Key Default Extra Content
    id bigint(20) NO PRI NULL auto_increment id
    keyword_id bigint(20) NO MUL NULL 关键词id
    taobao_category_id bigint(20) NO MUL NULL 分类id
    brand_id bigint(20) NO NULL 品牌id
    attrib_list varchar(200) NO NULL 属性标记
    score float(10,4) NO NULL 类目相关度得分

    关关键报表

    • 表名
      keyword_report_all
    • 数据量
      101293616
    • 表结构
    Field Type Null Key Default Extra Content
    id bigint(20) unsigned NO PRI NULL auto_increment id
    is_empty enum('Y','N') NO MUL Y 是否为空
    get_date date NO NULL 获取日期
    impression int(10) unsigned NO NULL 展现量
    click int(10) unsigned NO NULL 点击量
    cost int(10) unsigned NO NULL 花费
    directtransaction int(10) unsigned NO NULL
    indirecttransaction int(10) unsigned NO NULL
    directtransactionshipping int(10) unsigned NO NULL
    indirecttransactionshipping int(10) unsigned NO NULL
    favitemtotal int(10) unsigned NO NULL
    favshoptotal int(10) unsigned NO NULL
    transactionshippingtotal int(10) unsigned NO NULL
    transactiontotal int(10) unsigned NO NULL
    favtotal int(10) unsigned NO NULL
    competition int(10) unsigned NO NULL
    ctr float(6,2) NO NULL
    cpc float(6,2) NO NULL
    roi float(6,2) NO NULL
    coverage float(6,2) NO NULL

    淘宝属性值表

    • 表名
      taobao_item_value
    • 数据量
      8563521
    • 表结构
    Field Type Null Key Default Extra Content
    cid int(11) NO PRI NULL 分类cid
    pid int(11) NO PRI NULL 父id
    vid int(11) NO PRI NULL 属性值id
    name varchar(150) NO NULL 属性名

    相关文章

      网友评论

          本文标题:直通车选词

          本文链接:https://www.haomeiwen.com/subject/xsmplqtx.html