1、完成采用3C训练集商品级问法的模型训练与知识库更新。
2、基于商品类目属性数据(来自勇哥)进行聚类划分品类,具体实施与数据如下:
1)总共的cid数为395条,属性特征数为1062个(特征非常稀疏,有些特征只有一两个cid才有)
2)对以上395条数据进行kmeans聚类,K值备选集合如下:
Ks = [50, 60, 70, 80, 90, 100, 120, 150, 160, 170, 180]
最终在70个类上Calinski-Harabasz系数最大,聚类效果较好。
1、完成采用3C训练集商品级问法的模型训练与知识库更新。
2、基于商品类目属性数据(来自勇哥)进行聚类划分品类,具体实施与数据如下:
1)总共的cid数为395条,属性特征数为1062个(特征非常稀疏,有些特征只有一两个cid才有)
2)对以上395条数据进行kmeans聚类,K值备选集合如下:
Ks = [50, 60, 70, 80, 90, 100, 120, 150, 160, 170, 180]
最终在70个类上Calinski-Harabasz系数最大,聚类效果较好。
本文标题:2021-02-02
本文链接:https://www.haomeiwen.com/subject/jtoytltx.html
网友评论