美文网首页
DSSM 的研究

DSSM 的研究

作者: Midorra | 来源:发表于2018-12-13 17:29 被阅读0次

DSSM 是很有意思的一种深度学习模型,个人对这个模型确实很感兴趣,它打破了对 word 做 WordEmbedding 的概念,而是可以直接对 Query 和 Doc 做 Embedding,而解决 One Hot 维度爆炸的方法就是借助了 Word Hashing 的巧妙设计。英文场景下 tri-grams 的 word hashing 方法取得很不错的效果,冲突概率也仅有 0.0044%,还是可以接受的;在中文场景下因为没有天然分词,确实会更难一些,需要一种针对中文的巧妙的 word hashing 方法。

目前没有看到相关靠谱资料,听说有将汉语文字转化成拼音的,还有将汉语文字转化成笔画的。蚂蚁金服之前推出了一个基于汉语拼音笔画的 DSSM 尝试,成为 cw2vec 算法,如下两篇资源介绍:

https://yq.aliyun.com/articles/376139

https://bamtercelboo.github.io/2018/05/11/cw2vec/

另外还有一点值得一提的是,DSSM 在训练时尽量避免了对原始数据的处理,并且用一个滑动窗口在数据上进行遍历,这种计算方式和图像识别算法感觉颇为相似,这给我们一点启发,就是是否可以打破思维界限,将图像识别算法引入自然语言处理的可能性


下面几篇资源介绍了 DSSM 和它的一些变体,可以作为参考目录自行深度研究

https://www.cnblogs.com/baiting/p/7195998.html

https://blog.csdn.net/zkq_1986/article/details/79128844


论文已经下载 在本地电脑 D://资料/VIP 论文/DSSM

相关论文:

Huang P S, He X, Gao J, et al. Learning deep structured semantic models for web search using clickthrough data[C]// ACM International Conference on Conference on Information & Knowledge Management. ACM, 2013:2333-2338.

Shen, Yelong, et al. “A latent semantic model with convolutional-pooling structure for information retrieval.” Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management. ACM, 2014.

Palangi, Hamid, et al. “Semantic modelling with long-short-term memory for information retrieval.” arXiv preprint arXiv:1412.6629 (2014).

Elkahky, Ali Mamdouh, Yang Song, and Xiaodong He. “A multi-view deep learning approach for cross domain user modeling in recommendation systems.” Proceedings of the 24th International Conference on World Wide Web. International World Wide Web Conferences Steering Committee, 2015.

相关文章

  • DSSM 的研究

    DSSM 是很有意思的一种深度学习模型,个人对这个模型确实很感兴趣,它打破了对 word 做 WordEmbedd...

  • 常用操作2

    dssm常用表 create table hs_dssm_dic_query_7 asselect distinc...

  • DSSM

    Learning Deep Structured Semantic Models for Web Search u...

  • DSSM

    原文:Learning Deep Structured Semantic Models for Web Searc...

  • 2019-08-09工作进展3

    对比关键词没有权重的dssm模型的效果 train_query : hs_dssm_dic_query_1 - |...

  • 2019-09-04工作进展

    昨天工作: mv-dssm效果改善:mv-dssm重新设计商品图片和title信息融合获取融合特征的attenti...

  • 2019-08-26工作进展

    上周五工作: 使用品类关键词来进行dssm网络负样本的采样,在新的训练集上进行dssm网络的训练,inferenc...

  • 20190731工作进展

    昨天工作:训练数据手动id化,对dssm网络进行修改,并使用新数据对dssm网络重新训练,现阶段训练结果acc0....

  • Recommendation with Deep Structu

    Deep Structured Semantic Model (DSSM) [1] is a deep neura...

  • 推荐系统14- DSSM 文本相似度模型

    DSSM Deep Structured Semantic Models 原理 通过 Query 和 Tit...

网友评论

      本文标题:DSSM 的研究

      本文链接:https://www.haomeiwen.com/subject/ubebhqtx.html