美文网首页
2019-08-30工作进展

2019-08-30工作进展

作者: Songger | 来源:发表于2019-10-02 00:01 被阅读0次

昨天工作:

  1. 尝试使用关键字对应的方式进行query和title的对应,可以得到非常准确的结果,关联到的query有8127条,商品有18.8w条,结果在hs_tmp_339中。分析:
    (1)有2496条query关联到的商品超过90条,这些query与商品的关联完全可以通过这种方式来进行。
    (2)4345条query对应的商品数量超过30条,这些query可以通过这种方式得到最相近的title,可以通过dssm的方式对结果进行补充。
    (3)其他的query只能使用神经网络的方式进行对应。
  2. 使用ugc数据进行inference的部分结果在hs_tmp_345中。有很多bad case,可能需要在inference之前使用类目过滤等方式进行一下预处理。
  3. 图片feature还在提取中。

今天计划:
完善转正答辩ppt

  1. 这个bad case的原因:
    CHICYOU黑白两色吊带不规则V领包臀显瘦性感经典修身连衣裙小黑裙
    206835022540

select * from jl_jingyan_query_related_video_pool where where ds=max_pt('tbcdm.dim_tb_itm_image') and id = 206835022540;

create table hs_tmp_315 as select item_id, concat('https://img.alicdn.com/imgextra/',image_url) as url, image_position, type from tbcdm.dim_tb_itm_image where ds=max_pt('tbcdm.dim_tb_itm_image');

  1. 调参

pai -name tensorflow140 -Dscript="file:///home/hengsong/origin_deep_cluster_odps_8.tar.gz" -DentryFile="inference_v10.py" -Dcluster='{"worker":{"count":1, "cpu":200, "memory":4000}, "ps":{"count":1, "cpu":200, "memory":5000}}' -DuseSparseClusterSchema=True -DenableDynamicCluster=True -Dtables="odps://graph_embedding/tables/hs_train_data_dssm_v2_7,odps://graph_embedding/tables/hs_test_data_dssm_v2_7,odps://graph_embedding/tables/hs_tmp_267" -Doutputs="odps://graph_embedding/tables/hs_dssm_result_5" -DcheckpointDir="oss://bucket-automl/hengsong/?role_arn=acs:ram::1293303983251548:role/graph2018&host=cn-hangzhou.oss-internal.aliyun-inc.com" -DuserDefinedParameters="--learning_rate=3e-4 --batch_size=1024 --is_save_model=True --attention_type=1 --num_epochs=1 --ckpt=hs_ugc_video_2e_4.ckpt" -DuseSparseClusterSchema=True;

1 : 20190830115537491g7b0nvyi2
3 : 20190830095434608g43s7hfj2

  1. mv-dssm

pai -name tensorflow140 -Dscript="file:///home/hengsong/origin_deep_cluster_odps_8.tar.gz" -DentryFile="train_mv_dssm_v3.py" -Dcluster='{"worker":{"count":1, "cpu":200, "memory":4000}, "ps":{"count":1, "cpu":200, "memory":5000}}' -DuseSparseClusterSchema=True -DenableDynamicCluster=True -Dtables="odps://graph_embedding/tables/hs_train_data_dssm_v2_8,odps://graph_embedding/tables/hs_test_data_dssm_v2_8,odps://graph_embedding/tables/hs_tmp_267" -Doutputs="odps://graph_embedding/tables/hs_dssm_result_5" -DcheckpointDir="oss://bucket-automl/hengsong/?role_arn=acs:ram::1293303983251548:role/graph2018&host=cn-hangzhou.oss-internal.aliyun-inc.com" -DuserDefinedParameters="--learning_rate=3e-4 --batch_size=1024 --is_save_model=True --attention_type=1 --num_epochs=1 --ckpt=hs_ugc_video_2e_4.ckpt" -DuseSparseClusterSchema=True;

20190903024511564gmmpvvyi2

相关文章

  • 2019-08-30工作进展

    昨天工作: 尝试使用关键字对应的方式进行query和title的对应,可以得到非常准确的结果,关联到的query有...

  • Lan的ScalersTalk第四轮新概念朗读持续力训练Day

    练习材料: [Day 1799 2019-08-30] Lesson 37-4 The process of ag...

  • 2019-08-30看足球:欧罗巴杯 01:15 莫斯科斯巴达

    2019-08-30 欧罗巴杯 01:15 莫斯科斯巴达 VS 布拉加 主队信息: 在首回合交手莫斯科斯巴达以0-...

  • 工作进展

    来到徐工半月有余了,是时候对这段时间总结一下了。首先说一下工作内容,我应聘的岗位是动力电池设计师,当时乐观的想是关...

  • 行事手段

    光明正大的不利于工作进展。

  • 用心去感受“孤独”

    拥有了孤独的人,才能拥有真正的自我。 2019-08-30 学习实验第30天打卡 最终目标:操着一口流利的英语,拥...

  • 瓦努阿图公布旅游最新资讯

    瓦努阿图旅游危机应对和恢复计划(TCRRP)日前公布最新工作进展,本周的工作进展集中在卫生方面。该工作组由政府和私...

  • 2019-08-31间歇跑5

    时间:2019-08-30 线路:绿道 成绩:间歇跑800米*6用时59分 感受:今天是8月最后一次跑步,全月共跑...

  • 20190805工作进展

    上周五工作: 使用手肘法测试top 1w query最佳聚类类别数,但是在这一数据中,sse斜率变化不大,分析的原...

  • 20190711工作进展

    得到了title表和叶子类目的对应关系hs_leaf_class_for_title确认有些title表中的项目在...

网友评论

      本文标题:2019-08-30工作进展

      本文链接:https://www.haomeiwen.com/subject/jjdnectx.html