Python 数据处理

Python 数据处理

作者: 正在充电Loading | 来源:发表于2017-08-24 22:10 被阅读0次

from sklearn.preprocessing import MinMaxScaler# -*- coding: utf-8 -*-

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data1.csv')

#Min-Max标准化

scaler = MinMaxScaler()

data['标准化累计票房'] = scaler.fit_transform(data['累计票房'])

data['标准化豆瓣评分'] = scaler.fit_transform(data['豆瓣评分'])

#Z-Score标准化

from sklearn.preprocessing import scale

data['标准化累计票房'] = scale(data['累计票房'])

data['标准化豆瓣评分'] = scale(data['豆瓣评分'])

#Normalizer归一化

from sklearn.preprocessing import Normalizer

scaler = Normalizer()

data['归一化累计票房'] = scaler.fit_transform(

data['累计票房']

)[0]

data['归一化豆瓣评分'] = scaler.fit_transform(

data['豆瓣评分']

)[0]

# -*- coding: utf-8 -*-

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data2.csv')

data['症状'] = data['症状'].astype('category')

dummiesData = pandas.get_dummies(

data,

columns=['症状'],

prefix=['症状'],

prefix_sep="_"

)

import pandas

data = pandas.read_csv('D:\\PDM\\6.1\\data3.csv')

from sklearn.preprocessing import Imputer;

#'mean', 'median', 'most_frequent'

imputer = Imputer(strategy='mean')

imputer.fit_transform(data[['累计票房']])

相关文章

网友评论

本文标题：Python 数据处理

本文链接：https://www.haomeiwen.com/subject/yckydxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python 数据处理|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！