美文网首页
09 Hog_SVM小狮子识别(监督学习)

09 Hog_SVM小狮子识别(监督学习)

作者: 犬夜叉写作业 | 来源:发表于2020-03-31 11:40 被阅读0次

    1、准备训练的样本(正负样本,负样本一定不能出现正样本,反之亦然)
    2、对样本进行hog+svm的训练
    3、使用一张图片进行测试 test

    样本特点 :

    pos 正样本,包含所检测的目标 (图片大小64 * 128)
    neg 负样本,不包含所检测的目标 (图片大小64 * 128)

    样本的获取:(一个好的样本要远胜过一个好的神经网络,样本容量很大,达到百万或千万张)

    一、网络: 1、公司(1张图1元) 2、爬虫自己爬取
    二、公司内部:1、多年积累 2、红外图像,自己积累
    三、自己收集: 达到万类很能自己收集,做demo的时候,可通过视频截取简化过程(比如录制100s 的视频,假设每秒30帧,则100 * 30 = 3000张样本)

    正样本的特点: 尽可能多样 (环境多样,干扰多样)

    视频分解为图片
    图片等比缩放
    图片裁剪到一样大小

    样本准备: pos 820 neg 1931 (一般正负样本的比例在1:2 与1:3之间)

    名字要按照一定规律命名,方便遍历提取

    步骤:
    1、设置参数-----包括:winSize(窗体大小),blockSize(block大小),blockStride(block的步长),cellSize(cell大小),nBin(bin的个数)
    2、创建一个hog
    3、创建svm,设置各种参数
    4、计算一下hog(computer hog)
    5、给计算的hog一个label标签
    6、开始训练
    7、开始预测,绘图显示

    # 训练
    # 1 参数 2hog 3 svm 4 computer hog 5 label 6 train 7 pred 8 draw
    import cv2
    import numpy as np
    import matplotlib.pyplot as plt
    # 1 par
    PosNum = 820    #正样本个数
    NegNum = 1931   #负样本个数
    winSize = (64,128)      #窗体大小
    blockSize = (16,16)# 105 个 block  (设置block大小)
    blockStride = (8,8)#4 cell  (设置block的步长为8*8)
    cellSize = (8,8)       #cell的大小
    nBin = 9#9 bin 3780     #bin的个数设置为9
    
    # 2 hog create hog 1 win 2 block 3 blockStride 4 cell 5 bin
    #创建block
    hog = cv2.HOGDescriptor(winSize,blockSize,blockStride,cellSize,nBin)
    # 3 svm分类器的创建
    svm = cv2.ml.SVM_create()
    # 4 computer hog
    featureNum = int(((128-16)/8+1)*((64-16)/8+1)*4*9) #3780,定义特征维度,当前block个数(128-16)/8+1),窗体大小(64-16)/8+1)
    featureArray = np.zeros(((PosNum+NegNum),featureNum),np.float32) #定义数组存储特征,行为正负样本个数,列为特征个数
    labelArray = np.zeros(((PosNum+NegNum),1),np.int32)
    # svm 监督学习 样本 标签 svm -》image hog  
    for i in range(0,PosNum):    #遍历图片
        fileName = 'pos\\'+str(i+1)+'.jpg'  #在mac系统下要将\\改为/
        img = cv2.imread(fileName)     #加载进彩色图片
        hist = hog.compute(img,(8,8))# 3780   #计算hog特征
        for j in range(0,featureNum):       #装载到二维数组中
            featureArray[i,j] = hist[j]
        # featureArray hog [1,:] hog1 [2,:]hog2 
        labelArray[i,0] = 1    #正样本标签设置为1
        # 正样本 label 1
        
    for i in range(0,NegNum):   #处理负样本
        fileName = 'neg\\'+str(i+1)+'.jpg'
        img = cv2.imread(fileName)
        hist = hog.compute(img,(8,8))# 3780
        for j in range(0,featureNum):
            featureArray[i+PosNum,j] = hist[j]
        labelArray[i+PosNum,0] = -1
    # 负样本 label -1
    
    #设置svm的属性
    svm.setType(cv2.ml.SVM_C_SVC)   #ml表示machine learning,添加类型
    svm.setKernel(cv2.ml.SVM_LINEAR)    #设线性置内核
    svm.setC(0.01)
    
    # 6 train 
    ret = svm.train(featureArray,cv2.ml.ROW_SAMPLE,labelArray)
    # 7 myHog :《-myDetect
    # myDetect-《resultArray  rho
    # myHog-》detectMultiScale
    
    #首先要创建一个myHog对象,则要创建myDetect
    #myDetect为数组,数据来源于resultArray(通过公式计算) 和rho(通过svm训练得到的)
    #通过myHog直接调用detectMultiScale方法来完成预测
    
    # 7 检测  核心:create Hog -> myDetect—> array-> 
    # resultArray-> resultArray = -1*alphaArray*supportVArray
    # rho-> svm-〉svm.train
    
    alpha = np.zeros((1),np.float32)
    rho = svm.getDecisionFunction(0,alpha)
    print(rho)
    print(alpha)
    alphaArray = np.zeros((1,1),np.float32)
    supportVArray = np.zeros((1,featureNum),np.float32)   #如果来自己重新训练样本,只要把这部分重新计算一下
    resultArray = np.zeros((1,featureNum),np.float32)
    alphaArray[0,0] = alpha  #因为是1行1列,所以采用[0,0]来访问
    resultArray = -1*alphaArray*supportVArray
    
    # detect,核心是创建myHog,以下为创建过程
    myDetect = np.zeros((3781),np.float32)
    for i in range(0,3780):
        myDetect[i] = resultArray[0,i]  #resultArray是3780维的 
    myDetect[3780] = rho[0] # rho svm (判决) 1行1列,1维的  
    #myDetect是数组,3781维,其中3780来自resultArra,最后一维来自rho
    
    myHog = cv2.HOGDescriptor()    #构建hog
    myHog.setSVMDetector(myDetect)   #设置属性
    
    # load 
    imageSrc = cv2.imread('Test2.jpg',1)   #读取待检测的图片,读取为彩色图
    # (8,8) win 
    objs = myHog.detectMultiScale(imageSrc,0,(8,8),(32,32),1.05,2)  #开始检测,(32,32)窗体大小,1.05表示缩放
    # xy wh ,objs是三维的, 以下参数放在这个三维参数的最后一维
    x = int(objs[0][0][0])
    y = int(objs[0][0][1])
    w = int(objs[0][0][2])  #宽
    h = int(objs[0][0][3])  #高
    # 绘制展示
    cv2.rectangle(imageSrc,(x,y),(x+w,y+h),(255,0,0),2)  #线条宽度2
    cv2.imshow('dst',imageSrc)
    cv2.waitKey(0)
    
    
    

    相关文章

      网友评论

          本文标题:09 Hog_SVM小狮子识别(监督学习)

          本文链接:https://www.haomeiwen.com/subject/xfvbuhtx.html