美文网首页
2019-08-26工作进展

2019-08-26工作进展

作者: Songger | 来源:发表于2019-08-26 16:39 被阅读0次

上周五工作:

  1. 使用品类关键词来进行dssm网络负样本的采样,在新的训练集上进行dssm网络的训练,inference效果:acc:0.699 auc:0.703 precision:0.941;
  2. 对文章Gated Attentive-Autoencoder for Content-Aware Recommendation之中用到的使用attention矩阵代替attention向量的方式进行了测试,并在其基础上增加了mask,使用该结构代替原网络中的self-attention模块,将da参数设置为20的情况下,inference效果:acc:0.635 auc:0.611 precision:0.911。说明这一方式有着不错的效果,可以将其添加到mv-dssm中以尝试改善mv-dssm网络的效果。

今天计划:

  1. 在当前mv-dssm网络的基础上添加attention层;

  2. 重新采样mv-dssm训练数据。

  3. mv-dssm & attention

pai -name tensorflow140 -Dscript="file:///home/hengsong/origin_deep_cluster_odps_8.tar.gz" -DentryFile="train_inference_v10.py" -Dcluster='{"worker":{"count":50, "cpu":200, "memory":4000}, "ps":{"count":10, "cpu":200, "memory":5000}}' -DuseSparseClusterSchema=True -DenableDynamicCluster=True -Dtables="odps://graph_embedding/tables/hs_train_data_dssm_v2_7,odps://graph_embedding/tables/hs_test_data_dssm_v2_7,odps://graph_embedding/tables/hs_tmp_267" -Doutputs="odps://graph_embedding/tables/hs_dssm_result_5" -DcheckpointDir="oss://bucket-automl/hengsong/?role_arn=acs:ram::1293303983251548:role/graph2018&host=cn-hangzhou.oss-internal.aliyun-inc.com" -DuserDefinedParameters="--learning_rate=3e-4 --batch_size=1024 --is_save_model=True --attention_type=1 --num_epochs=1 --ckpt=hs_ugc_video_2e_1.ckpt" -DuseSparseClusterSchema=True;

pai -name tensorflow140 -Dscript="file:///home/hengsong/origin_deep_cluster_odps_8.tar.gz" -DentryFile="inference_v10.py" -Dcluster='{"worker":{"count":1, "cpu":200, "memory":4000}, "ps":{"count":1, "cpu":200, "memory":5000}}' -DuseSparseClusterSchema=True -DenableDynamicCluster=True -Dtables="odps://graph_embedding/tables/hs_train_data_dssm_v2_7,odps://graph_embedding/tables/hs_test_data_dssm_v2_7,odps://graph_embedding/tables/hs_tmp_267" -Doutputs="odps://graph_embedding/tables/hs_dssm_result_5" -DcheckpointDir="oss://bucket-automl/hengsong/?role_arn=acs:ram::1293303983251548:role/graph2018&host=cn-hangzhou.oss-internal.aliyun-inc.com" -DuserDefinedParameters="--learning_rate=3e-4 --batch_size=1024 --is_save_model=True --attention_type=1 --num_epochs=1 --ckpt=hs_ugc_video_2e_1.ckpt-3" -DuseSparseClusterSchema=True;

  1. mv-dssm数据构造

create table hs_tmp_315 as select item_id, concat('https://img.alicdn.com/imgextra/',image_url) as url, image_position, type from tbcdm.dim_tb_itm_image where ds=max_pt('tbcdm.dim_tb_itm_image');

create table hs_tmp_316 as select distinct a.title_id, b.item_id, a.title from hs_query_title_inference_gt_3 a join hs_dssm_dic_title_11 b on a.title == b.title;

create table hs_tmp_317 as select distinct a.* from hs_tmp_315 a join hs_tmp_303 b on a.item_id == b.item_id;

create table hs_tmp_318 as select a.* from hs_tmp_315 a join hs_tmp_303 b on a.item_id == b.item_id;

  1. 测试mv-dssm网络

se_keyword_mainse_ws,title_mainse_ws, pic_mainse_ws, label

create table hs_tmp_319 as select *, se_keyword_mainse_ws as pic_mainse_ws from hs_test_data_dssm_v2_7 limit 1000000;

create table graph_embedding.hs_tmp_320 as select * from graph_embedding.hs_tmp_319 limit 10000;

相关文章

  • 2019-08-26工作进展

    上周五工作: 使用品类关键词来进行dssm网络负样本的采样,在新的训练集上进行dssm网络的训练,inferenc...

  • 2019-08-27

    2019-08-26 亮剑_f5b9 字数 353 · 阅读 32 2019-08-26 05:22 亮剑_f5b...

  • Lan的ScalersTalk第四轮新概念朗读持续力训练Day

    练习材料: [Day 1795 2019-08-26] Lesson 36-3 The cost of gover...

  • 8月26日

    2019-08-26 毛雅亭 字数 572 · 阅读 17 2019-06-02 18:39 ...

  • “财富”只是一个入口

    化蛹2019-08-26 Mysterious Entrance To New Life 我的财富工作坊,常常会吸...

  • 工作进展

    来到徐工半月有余了,是时候对这段时间总结一下了。首先说一下工作内容,我应聘的岗位是动力电池设计师,当时乐观的想是关...

  • DALS026-批次效应02-发现批次效应

    title: DALS026-批次效应02-发现批次效应date: 2019-08-26 12:0:00type:...

  • EF DBFirst点记

    2019-08-26补充: 生产实体之前需要保证项目没有错误。 保证web.config/app.config生成...

  • 做最好的自己

    author:XiaoGuadate:2019-08-26 今日份的励志: 世间没有绝对的完美,生命本身就是由一些...

  • 努力,遇见更好的自己

    努力,遇见更好的自己 双阳317李炎 字数 1001 · 阅读 0 2019-08-26 16:43 当炎炎夏日...

网友评论

      本文标题:2019-08-26工作进展

      本文链接:https://www.haomeiwen.com/subject/aizlectx.html