今天还是继续在学习建模前各种特征的处理,补充总结一些知识点:
1.针对于列中比较多列类型为object的,可以用for循环遍历地替换--将其编码成为数值形式。 粘上示例代码段:
![](https://img.haomeiwen.com/i16461660/419cf68dfe9ccec2.jpg)
2. 由df.decribe(include=“include”)可以求出字符串类型的特征的描述,如下:
![](https://img.haomeiwen.com/i16461660/436af487131c9d31.jpg)
可以从第二行unique看出一些信息,去结合怎么对象型的编码。
今天还是继续在学习建模前各种特征的处理,补充总结一些知识点:
1.针对于列中比较多列类型为object的,可以用for循环遍历地替换--将其编码成为数值形式。 粘上示例代码段:
2. 由df.decribe(include=“include”)可以求出字符串类型的特征的描述,如下:
可以从第二行unique看出一些信息,去结合怎么对象型的编码。
本文标题:6.11 建模前准备(二)
本文链接:https://www.haomeiwen.com/subject/zyeitktx.html
网友评论