1、分析与讨论商品级问题解决方案,商品级问题划分为商品属性问题与商品包问法问题。
2、对阈值以上与阈值以下的数据进行聚类并分析(聚类之后信息丢失比较大,一大半的数据在聚类过程中都被丢失了),如果以聚类结果定义商品行业包的话还需要人工再次清洗整理数据。
3、调研与构建交互式匹配模型ESIM,并用LCQMC数据集(LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同)验证,不卡阈值(即大于0.5认为语义相同)是acc为83%。
4、完成美妆行业10家店铺的售后原因分析。
网友评论