1、confusion matrix 在scikit里面原来是竖着的
竖着加起来才是所有的。原来我一直以为是横着操作的
2、在进行差集操作的时候,以下的操作每次都会乱序,这一步真的坑死我
seq_features_2 =list(set(all_features_2).difference(set(dis_features_2)))# b中有而a中没有的
selected_2 =list(set(all_features_2).difference(["settlement_type"]))
3、解决问题我思考的步骤:
A 怀疑是模型保存时候出现问题了,查了lightGBM的三种模型保存方式,joblib pickle save_model
B 以为是model predict的时候出现问题,设置了random.seed
C 以为在进行离散特征连续化的时候出现了问题,将数据保存了下来
D 查看是否是输入输出的问题,label没错,但是输入每次都在变化
E 期间跑lightGBM的时候出现了问题,问题主要包含两种,第一种是所有的label都一样,第二种是
特种中包含了label
F 最终发现了问题所在
4、进行表连接的时候,采用外连接还有左连接都会出现错误
今天终于认真的思考了表连接的关系
网友评论