美文网首页
Python数据分析学习笔记(一):安装分析包以及数据基础处理

Python数据分析学习笔记(一):安装分析包以及数据基础处理

作者: yayalisa小可乐 | 来源:发表于2018-06-06 16:08 被阅读0次

    #安装各种数据分析库(本人使用mac系统,2.7版本python)

    #在terminal中使用pip install 完成各种包的安装

    sudo pip install numpy

    sudo pip install scipy

    sudo pip install matplotlib

    sudo pip install scikit-learn

    引入包文件

    import math

    import pandas as pd

    import numpy as np

    import scipy

    import matplotlib

    import sklearn

    #读取csv文件

    data=pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data',names=column_names)

    #将?替换成标准缺失值表示

    data=data.replace(to_replace='?',value=np.nan)

    #丢弃带有缺失值的数据(只要有一个维度缺失)

    data=data.dropna(how='any')

    #将原始数据分割为25%测试集,75%训练集

    from  sklearn.cross_validation import train_test_split

    X_train,X_test,y_train,y_test=train_test_split(data[column_names[1:10]],data[column_names[10]],test_size = 0.25,random_state=33)

    #查验训练样本的数量和类别分布

    print y_train.value_counts()

    print y_test.value_counts()

    相关文章

      网友评论

          本文标题:Python数据分析学习笔记(一):安装分析包以及数据基础处理

          本文链接:https://www.haomeiwen.com/subject/mchpzxtx.html