Python数据分析学习笔记（一）：安装分析包以及数据基础处理

作者: yayalisa小可乐 | 来源:发表于2018-06-06 16:08 被阅读0次

Python数据分析学习笔记（一）：安装分析包以及数据基础处理
2019-10-12
《基于Python的大数据分析基础及实战》（余本国）PDF电子书
数据挖掘小组学习记录——20190728-2
Python资料
学习计划：第02周(20190722-20190728)
数据分析（1）--Numpy
《Wireshark数据包分析实战》（一）数据包分析简介与网络基
数据分析指北 - 基础(基础数据操作之一)
python 数据分析基础 day11－mysql安装

#安装各种数据分析库（本人使用mac系统，2.7版本python）

#在terminal中使用pip install 完成各种包的安装

sudo pip install numpy

sudo pip install scipy

sudo pip install matplotlib

sudo pip install scikit-learn

引入包文件

import math

import pandas as pd

import numpy as np

import scipy

import matplotlib

import sklearn

#读取csv文件

data=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data',names=column_names)

#将？替换成标准缺失值表示

data=data.replace(to_replace='?',value=np.nan)

#丢弃带有缺失值的数据（只要有一个维度缺失）

data=data.dropna(how='any')

#将原始数据分割为25%测试集，75%训练集

from sklearn.cross_validation import train_test_split

X_train,X_test,y_train,y_test=train_test_split(data[column_names[1:10]],data[column_names[10]],test_size = 0.25,random_state=33)

#查验训练样本的数量和类别分布

print y_train.value_counts()

print y_test.value_counts()

网友评论

本文标题：Python数据分析学习笔记（一）：安装分析包以及数据基础处理

本文链接：https://www.haomeiwen.com/subject/mchpzxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python数据分析学习笔记（一）：安装分析包以及数据基础处理

相关文章

Python数据分析学习笔记（一）：安装分析包以及数据基础处理

2019-10-12

《基于Python的大数据分析基础及实战》（余本国）PDF电子书

数据挖掘小组学习记录——20190728-2

Python资料

学习计划：第02周(20190722-20190728)

数据分析（1）--Numpy

《Wireshark数据包分析实战》（一）数据包分析简介与网络基

数据分析指北 - 基础(基础数据操作之一)

python 数据分析基础 day11－mysql安装

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读