美文网首页
BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别

BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别

作者: 灯红酒绿映不出的落寞 | 来源:发表于2017-08-10 16:11 被阅读268次

提起AI,想必大家感觉就是神秘莫测,结合现实。今天看了一下BaiduOCR的技术支持,大概实现了身份证,银行卡,机动车牌,图片审核,这几个案例的识别。不得不说百度对图像的处理还是很强大的。根据开源出来的接口实现对以上功能的开发还是不错的。

废话不多说,既然那么神秘,我们也可以试着自己做一个识别Demo,案例会在最下方提供
1.点击链接BaiduAI

进入控制台登陆自己的百度云账号


2.登陆成功会进入自己的控制台,默认开通的服务如下

我们以文字识别为例,点击文字识别,


可以看到可用服务列表,并不是绝对免费的。但是程序员拿来装X应该没问题

3.创建应用

图中信息很明确,根据自己需要勾选相应的功能,当然部分功能是收费的,具体收费标准点这里

因为程序语言为Object-C 运用于ios上,所以这里我直接勾选如上图,(这里需要注意一点,包名绑定这里,必须要绑定自己创建的工程Bundle Identifier。要不等你一切做好之后发现会提示不匹配工程)确认无误后点击立即创建


创建成功,点击应用详情,进入自己创建的应用查看详情


拿到了自己的APPID,APIKey,SecretKey,记得保存一份,等下项目中要想实现以上功能必须通过这几个东西生成BaiduOCR的Token用,才可以。下边的API列表很详细的告诉我们当前这个项目接入的Api同时收费情况一目了然。很清晰。

4.接入服务

到了这一步,相信你已经成为一名合格的百度OCR的开发者了。下边开始把OCR服务接入我们工程
1.获取百度OCR Access Token
根据官方文档获取Access Token并保存到本地(注意token有效期为30天,过期需要重新获取接口保存token)

static NSString * const BaiduAppID           = @"9991413";
static NSString * const BaiduApiKey          = @"E2jIt1TZqt1EVYGVdH3L1Tb3";
static NSString * const BaiduSecretKey       = @"kIf9V9BktenQCFG8EpmlWChvlTz6GKbl";
static NSString * const BaiduAccess_tokenUrl = @"https://aip.baidubce.com/oauth/2.0/token";
#pragma mark - 获取百度AIAccess Token。有效期为30天
- (void)getBaiduAIAccessToken{
    /*
     请求URL数据格式
     
     向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:
     
     grant_type: 必须参数,固定为client_credentials;
     client_id: 必须参数,应用的API Key;
     client_secret: 必须参数,应用的Secret Key;
     
     https://aip.baidubce.com/oauth/2.0/token?
     grant_type=client_credentials&
     client_id=Va5yQRHlA4Fq4eR3LT0vuXV4&
     client_secret= 0rDSjzQ20XUj5itV7WRtznPQSzr5pVw2&
     
     
     */
    //    [[AipOcrService shardService] authWithAK:@"sLdWP9rGQ7iu63Pi4hvUP3qw" andSK:@"WF2fWKb8lQ2bfGB5MAAsixIGXCUzWipX"];
    
    
    
    NSMutableDictionary * dictionary = [[NSMutableDictionary alloc]init];
    [dictionary setObject:@"client_credentials" forKey:@"grant_type"];
    [dictionary setObject:BaiduApiKey forKey:@"client_id"];
    [dictionary setObject:BaiduSecretKey forKey:@"client_secret"];
    
    
    [NetWorkTool postNetWorkWithURL:BaiduAccess_tokenUrl paramaters:dictionary success:^(id object) {
        NSLog(@"%@",object);
        NSString * access_token = [object objectForKey:@"access_token"];
        NSString * expiresHaveTime = [NSString stringWithFormat:@"%@",[object objectForKey:@"expires_in"]];
        [[NSUserDefaults standardUserDefaults] setObject:access_token forKey:AccessTokenKey];
        [[NSUserDefaults standardUserDefaults] setObject:expiresHaveTime forKey:TokenValidity];
        [[NSUserDefaults standardUserDefaults] synchronize];
        NSInteger validityTime = [expiresHaveTime integerValue];
        if (validityTime <=0 || !validityTime) {
            UIAlertController * alertC = [UIAlertController alertControllerWithTitle:@"Warring" message:@"您使用的百度AI识别功能Access_Token已失效,请重新获取" preferredStyle:UIAlertControllerStyleActionSheet];
            UIAlertAction * confirmAction = [UIAlertAction actionWithTitle:@"确定" style:UIAlertActionStyleDefault handler:^(UIAlertAction * _Nonnull action) {
                [self.window.rootViewController dismissViewControllerAnimated:YES completion:^{
                    
                    
                }];
                
            }];
            
            [alertC addAction:confirmAction];
            [self.window.rootViewController presentViewController:alertC animated:YES completion:nil];
            
            
        }
        
    } failure:^(id failure) {
        
        NSLog(@"%@",failure);
    }];
}

这里请求数据用到了自己对AFNetworking的简单封装,有兴趣可以到文章最后Demo地址进行查看

获取Access Token 成功的话,我们可以根据AI开放平台中的文字识别API技术文档来搞事情了。

以身份证识别为例

从官方给出的API文档可以看出,通过POST方法向BaiduAI服务器发起请求,重点是链接中必须携带刚才获取的Access Token,由此可以看出我们在百度AI平台创建应用的重要性了。。。

头部需携带一下参数
Content-Type    application/x-www-form-urlencoded
重要的是Body中带的参数,

可以看出 image是必须携带的,并且要求还很多

图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式

要求一大串,不过没办法。想要获取到数据,还是要老老实实跟着文档走。这个提出一个坑。卡了三天没找到原因(其实我也没那么笨啊)

base64编码,对于这个东西,真没细心理解过。百度给出以下定义
    /*
     NSDataBase64Encoding64CharacterLineLength其作用是将生成的Base64字符串按照64个字符长度进行等分换行
     NSDataBase64Encoding76CharacterLineLength其作用是将生成的Base64字符串按照76个字符长度进行等分换行
     NSDataBase64EncodingEndLineWithCarriageReturn其作用是将生成的Base64字符串以回车结束
     NSDataBase64EncodingEndLineWithLineFeed其作用是将生成的Base64字符串以换行结束。
     */
亲测只有使用了NSDataBase64EncodingEndLineWithCarriageReturn这个枚举的时候,图片识别才不会报图片格式错误。具体原因不详。有知道的麻烦不辞辛苦告知下
请求代码示例
身份证识别
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/idcard?access_token=24.f2c915b857ee62189abb7f92df0e8453.2592000.1499493935.282335-9395294' --data 'id_card_side=front&image=【图片Base64编码,需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'

到这里,其实基本功能已经实现。我们正常的通过拍照,或者相册中获取过来的图片,就可以识别出来了。

如果还想看更多的比如银行卡,车牌号,图文识别等的实现,请移步到我的GitHub地址
本文为个人原创,未经本人允许,禁止转载。

相关文章

  • BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别

    提起AI,想必大家感觉就是神秘莫测,结合现实。今天看了一下BaiduOCR的技术支持,大概实现了身份证,银行卡,机...

  • android中使用OpenCV之图像边缘检测

    目前比较火热的图像识别技术,如车牌号识别、身份证识别、人脸识别等,都广泛运用到了图像边缘检测,今天我所介绍的就是O...

  • opencv +数字识别

    现在很多场景需要使用的数字识别,比如银行卡识别,以及车牌识别等,在AI领域有很多图像识别算法,大多是居于openc...

  • 超强自主识别核心-移动端车牌识别

    手机拍照识别车牌是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术。...

  • 图像文本识别

    前言 我在过去的两三个月实现了护照的图像文字识别,回顾起来,网上虽有一部分身份证识别、银行卡识别的例子,但实际做起...

  • 深度剖析:车牌识别系统方案

    手机端车牌识别技术是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术...

  • 扫一扫移动端车牌识别

    手持端移动端车牌识别技术是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份...

  • 移动端车牌识别五大技术特点

    移动端车牌识别技术是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术...

  • 移动端车牌识别五大技术特点

    移动端车牌识别技术是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术...

  • 移动端车牌识别技术比较

    移动端车牌识别技术是指通过计算机视觉、图像处理与模式识别等方法从车辆图像中提取车牌字符信息,从而确定车辆身份的技术...

网友评论

      本文标题:BaiduOCR实现身份证,银行卡,机动车牌,图像审核等识别

      本文链接:https://www.haomeiwen.com/subject/qorhrxtx.html