美文网首页
Python机器学习基础教程学习笔记(1)——用到的库

Python机器学习基础教程学习笔记(1)——用到的库

作者: neumeng | 来源:发表于2019-08-27 17:00 被阅读0次

    Python机器学习基础教程学习笔记(1)——用到的库

    1 Numpy

    numpy数组

    import numpy as np
    x = np.array([[1,2,3],[4,5,6]])
    print("x:\n{}".format(x))
    
    x:
    [[1 2 3]
     [4 5 6]]
    

    2 Scipy

    scipy中最重要的是scipy.sparse,它可以给出稀疏矩阵

    from scipy import sparse
    # 创建一个三维Numpy数组,对角线为1,其余都为0
    eye = np.eye(4)
    print("NumPy array:\n{}".format(eye))
    
    NumPy array:
    [[1. 0. 0. 0.]
     [0. 1. 0. 0.]
     [0. 0. 1. 0.]
     [0. 0. 0. 1.]]
    
    # 将Numpy数组转换成CSR格式的稀疏矩阵
    # 只保存非零元素
    sparse_martrix = sparse.csr_matrix(eye)
    print("\nSciPy sparse CSR matrix:\n{}".format(sparse_martrix))
    
    SciPy sparse CSR matrix:
      (0, 0)    1.0
      (1, 1)    1.0
      (2, 2)    1.0
      (3, 3)    1.0
    
    # coo格式的稀疏矩阵
    data = np.ones(4)
    row_indices = np.arange(4)
    col_indices = np.arange(4)
    eye_coo = sparse.coo_matrix(data,(row_indices,col_indices))
    print("COO representation:\n{}".format(eye_coo))
    
    COO representation:
      (0, 0)    1.0
      (0, 1)    1.0
      (0, 2)    1.0
      (0, 3)    1.0
    

    3 matplotlib

    python的科学绘图库。

    在jupyter notebook中,可以使用%matplotlib notebook(这种写法可以交互)和%matplotlib inline命令,将图像直接显示在浏览器中。否则要调用plt.show来显示图像

    %matplotlib inline
    import matplotlib.pyplot as plt
    
    # 在-10和10之间生成一个数列,共100个数
    x = np.linspace(-10,10,100)
    # 用正弦函数创建第二个数组
    y = np.sin(x)
    # 用plot函数绘制一个数组关于另一个数组的折线图
    plt.plot(x,y,marker='x')
    # plt.show()
    
    [<matplotlib.lines.Line2D at 0x118f10198>]
    
    output_8_1

    4 Pandas

    # 利用字典创建DataFrame的一个小例子
    import pandas as pd
    from IPython.display import display
    
    # 创建关于人的简单数据集
    data = {
        'name':['john','anan','peter','linda'],
        'location':['new york','pairs','berlin','london'],
        'age':[24,13,53,33]
    }
    data_pandas = pd.DataFrame(data)
    # IPython.display可以在jupyter notebook中打印出“美观的”dataframe
    display(data_pandas)
    
    
    name location age
    0 john new york 24
    1 anan pairs 13
    2 peter berlin 53
    3 linda london 33
    # 选择年龄大于30的所有行
    display(data_pandas[data_pandas.age>30])
    
    name location age
    2 peter berlin 53
    3 linda london 33

    5 查看各库的版本

    import sys
    print("Python version:{}".format(sys.version))
    
    import pandas as pd
    print("pandas version:{}".format(pd.__version__))
    
    import matplotlib
    print("matplotlib version:{}".format(matplotlib.__version__))
    
    import numpy as np
    print("numpy version:{}".format(np.__version__))
    
    import scipy as sp
    print("scipy version:{}".format(sp.__version__))
    
    import IPython 
    print("IPython version:{}".format(IPython.__version__))
    
    import sklearn 
    print("sklearn version:{}".format(sklearn.__version__))
    
    Python version:3.7.3 (default, Mar 27 2019, 16:54:48) 
    [Clang 4.0.1 (tags/RELEASE_401/final)]
    pandas version:0.24.2
    matplotlib version:3.0.3
    numpy version:1.16.2
    scipy version:1.2.1
    IPython version:7.4.0
    sklearn version:0.20.3
    

    相关文章

      网友评论

          本文标题:Python机器学习基础教程学习笔记(1)——用到的库

          本文链接:https://www.haomeiwen.com/subject/lsgaxctx.html