[Python与数据分析]-8手写体图片降维

作者: 六千宛 | 来源:发表于2020-08-03 17:41 被阅读0次

[Python与数据分析]-8手写体图片降维
数据降维
机器学习实战Py3.x填坑记10—利用PCA来简化数据
单细胞笔记7-scRNA-seq去除批次效应
scRNA基础分析-4：细胞亚类再聚类、注释
scRNA基础分析-5：伪时间分析
scRNA基础分析-6：富集分析
scRNA基础分析-3：鉴定细胞类型
人脸识别基本原理
主成分分析丨数析学院

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
 
# 从互联网读入手写体图片识别任务的训练数据
digits_train = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tra',
                           header=None)
digits_test = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/optdigits/optdigits.tes',
                          header=None)
# 分割训练数据的特征向量和标记
X_digits = digits_train[np.arange(64)]
y_digits = digits_train[64]
 
# 从sklearn.decomposition导入PCA
from sklearn.decomposition import PCA
 
# 初始化一个可以将高维度特征向量（64维）压缩到2个维度的PCA
estimator = PCA(n_components=2)
X_pca = estimator.fit_transform(X_digits)
 
# 显示10类手写体数字图像经过PCA压缩后的2维空间分布
from matplotlib import pyplot as plt
 

def plot_pca_scatter():
    colors = ['black', 'blue', 'purple', 'yellow', 'white', 'red', 'lime', 'cyan', 'orange', 'gray']
 
    for i in range(len(colors)):
        px = X_pca[:, 0][y_digits.as_matrix() == i]
        py = X_pca[:, 1][y_digits.as_matrix() == i]
        plt.scatter(px, py, c=colors[i])
 
    plt.legend(np.arange(0, 10).astype(str))
    plt.xlabel('First Principal Component')
    plt.ylabel('Second Principal Component')
    plt.show()
 
 
plot_pca_scatter()

图片.png