美文网首页
20190718工作进展

20190718工作进展

作者: Songger | 来源:发表于2019-07-18 10:17 被阅读0次
  1. 给之己的表
    create table hs_result_title_query_1w_top1000_filtered_2 as
    select distinct b.index, b.query, a.video_id, b.title, b.item_id, b.score, b.cate_id, b.cate_name, b.url from
    (select coalesce(CONCAT('http://cloud.video.taobao.com', get_json_object(body, '.entities.k2.play_url/s')),CONCAT('http:', get_json_object(body, '.entities.k3.play_url/s')))as url, coalesce(get_json_object(body, '.entities.k3.video_id/l'), get_json_object(body, '.entities.k2.video_id/l')) as video_id from hs_jingyan_query_related_video_pool_2_3)a join (select * from hs_result_title_query_1w_top1000_filtered_1)b on a.url == b.url;

  2. DSSM tensorflow pai命令:
    pai -name tensorflow140 -Dscript="odps://ps_ads_model_train/resources/video_text2tag_v1.tar.gz"
    -DentryFile="inference.py" -Dcluster='{"worker":{"count":30, "gpu":50, "cpu":400, "memory":5000}, "ps":{"count":5, "cpu":200, "memory":5000}}'
    -Dtables="odps://palgo_wow/tables/zhiji_gul_video_dssm_text_idx_v2_fushi_need_to_tag"
    -DcheckpointDir="oss://bucket-automl/text2tag_m1/?role_arn=acs:ram::1293303983251548:role/video2019&host=cn-hangzhou.oss-internal.aliyun-inc.com"
    -Doutputs="odps://palgo_wow/tables/text2tag_2_class_inference_result_fushi"
    -DuserDefinedParameters="--learning_rate=1e-2 --vocab_size=221675 --batch_size=8 --maxinputsize_summary=80 --maxinputsize_title=16 --attention_type=1 --num_epochs=1 --ckpt=text2tags_fushi.ckpt-2 --max_area_number=2"
    -DuseSparseClusterSchema=True;

分词并去掉常用词
drop table if exists palgo_wow.zj_video_trigger_info_without_tags_ws_tmp;
create table if not exists palgo_wow.zj_video_trigger_info_without_tags_ws_tmp LIFECYCLE 2 as
select video_id,
search_kg:alinlp_segment(title, "YOUKU", "0", "1") as title_ws,
search_kg:alinlp_segment(summary, "YOUKU", "0", "1") as summary_ws,
duration,
cover_url,
search_kg:alinlp_segment(tag, "YOUKU", "0", "1") as tag_ws
from palgo_wow.zj_video_trigger_info_without_tags;

---去除常用词
DROP TABLE IF EXISTS palgo_wow.zj_video_trigger_info_without_tags_FreqWord_RM;
PAI -name FilterNoise -project algo_public
-DinputTableName=palgo_wow.zj_video_trigger_info_without_tags_ws_tmp
-DnoiseTableName=palgo_wow.qber_videotags_pool_tmp1_Noise_Word_Pool_Current
-DoutputTableName=palgo_wow.zj_video_trigger_info_without_tags_FreqWord_RM
-DselectedColNames="title_ws,summary_ws,tag_ws"
-Dlifecycle=30;

palgo_wow.zhiji_gul_video_dssm_text_idx_v2_fushi_need_to_tag
palgo_wow.qber_videotags_pool_tmp1_Noise_Word_Pool_Current

相关文章

  • 20190718工作进展

    给之己的表create table hs_result_title_query_1w_top1000_filter...

  • 20190718

    78.3公斤,杰的体重又下去了。他把减重放在第一位,每天吃的不多,还跳绳。他爸和我希望他能出去走走,但是他基本都是...

  • 20190718

    订房、订票、改签、退票、再订票。 似乎这两天一直在忙这些事情,但也是快乐着! 明天又将出发,也算是一次说走就走的旅...

  • 20190718

    感冒莫名其妙的就好了,前三天一直是鼻涕一把泪一把,喷嚏连天。现在就只有一点嗓子还没有恢复好。有时候,人真的需要工作...

  • 20190718

    为什么爸爸和杰讲话,讲不上三句话,就吵?原因在哪儿,原因大概:1杰不喜欢爸爸没有商量的,命令式的语气,爸爸高高在上...

  • 20190718

    思想:或许我们有时真的很累, 要面对未来那种看不见的无力感, 但千万不要停下来! 因为我们的人生不可能就只是现在这...

  • 20190718

    事件记录 今天早上到办公室就被通知,领导母亲去世,所以随份子,帮人和自己。然后派车。上午没什么大事,女儿他们上午就...

  • 20190718

    心情烦躁时如何?如何?除了自渡,还有什么办法呢?听首温柔的歌叭,见见想看的人叭。丢掉胡思乱想叭,在床上就睡一觉叭,...

  • 20190718

    时间过得好快!20190617入职世联汽车内饰已经一个月了。2019年3月4日入职长鼎电子,5月31日离职...

  • 20190718

    听完猫叔的分享,切己体察,结合过往的经历,我有以下心得: 1清单让你更清晰 大脑不是拿来记忆的,而是用来分析的,所...

网友评论

      本文标题:20190718工作进展

      本文链接:https://www.haomeiwen.com/subject/lcaqlctx.html