CV学习笔记（十九）：数据集拼接生成

CV学习笔记（十九）：数据集拼接生成

作者: 云时之间 | 来源:发表于2020-05-12 13:26 被阅读0次

CV学习笔记（十九）：数据集拼接生成
【Tool】Resource of Code and Datas
OpenCV 基本操作
CV学习笔记（十八）：文本数据集生成(text_renderer
Python机器学习基础教程学习笔记（4）——KNN处理wave
分享功能可以在这里找到哦
keras 数据集学习笔记 2/3
keras 数据集学习笔记 3/3
在ImageNet 1k数据集上训练CNN分类模型
在ImageNet 1k数据集上训练yolov5m-cls分类模

上一次使用了text_renderer尝试生成类似于银行卡的数据，但是实际下来效果并不好，我分析了一下原因：

①：text_renderer输出的背景和真实银行卡图片有很大的差异

②：大多数银行卡采用的是突出的字体，text_renderer很难去模拟

分析出以上的问题后，现在的重点开始转换成如何去近似的模拟银行卡数据集，最好的方法就是使用真实的银行卡卡号片段来拼接成数据。

一边说代码，一边捋顺思路：

一：准备数据

首先准备了大概50张的银行卡卡号片段的真实图片，尽量保证每张图片的长度为3-4位，为什么分为3-4位？分析了大多数的银行卡后，发现一个规律:

信用卡卡号：0000 0000 0000 0000

储蓄卡卡号：0000 0000 0000 0000 000

我们用CTPN检测的时候，往往会一段一段的检测，然后拼接起来，这种效果理论上会更好准备的数据如下：

图片的分辨率180*46

现在分析代码：

第一步：选择生成数量，读取图片

这部分注释很清楚，不再赘述

二：裁剪图片，拼接图片

这部分是整个程序之中的关键，我绘制了一个图，结合图来说一下

因为准备的数据集是3-4个字符一张图，DenseNet的输入长度为10时比较合适(具体为什么还没搞清楚)，因此拼接的图片字符长度也是10个字符：读取图片

这里用到cut_image函数对image3进行裁剪：

裁剪前后对比：

对图片进行拼接：

拼接后效果：

三：数据增强

因为DenseNet的输入为280*32的图像，并且为减少计算，需要将图像转换为灰度图像

转换为灰度图像后，这里需要使用ImageDataGenerator类，简单的说ImageDataGenerator是keras.processing.image模块里的图片生成器，每次喂进去一个batch_size的数据，然后对这个批次的数据进行样本增强，用来扩充样本数据集的大小，增强模型的泛化能力，更模拟真实情况，比如旋转，缩放，对比度转换等等。

四：划分训练集和测试集

我们将训练集和测试集按照8:2的比例进行划分

运行，数据生成完毕

相关文章

CV学习笔记（十九）：数据集拼接生成
上一次使用了text_renderer尝试生成类似于银行卡的数据，但是实际下来效果并不好，我分析了一下原因： ①：...
【Tool】Resource of Code and Datas
CV Datasets 深度学习数据集视觉代码和数据集 ML Dataset 音乐，文本，人脸等数据集 DL R...
OpenCV 基本操作
创建 cv::Mat OpenCV 中用数据格式 cv::Mat 存储图片。有以下几种生成 cv::Mat 的方...
CV学习笔记（十八）：文本数据集生成(text_renderer
在上一次我们进行完银行卡卡号定位后，有一个问题在于我们没办法获得很多的银行卡图片来进行训练，比较常规的方法是我们来...
Python机器学习基础教程学习笔记（4）——KNN处理wave
Python机器学习基础教程学习笔记（4）——KNN处理wave数据集（回归） 1 wave数据集 wave数据集...
分享功能可以在这里找到哦
Android学习笔记(十九)分享简单数据
keras 数据集学习笔记 2/3
keras 数据集的学习笔记 2/3 上次学习一些常用的数据集，本次将学习数据集的具体应用。各种常用的数据集数...
keras 数据集学习笔记 3/3
keras 数据集的学习笔记 3/3 深度学习需要有大量的数据集供机器来学习，本次就学习如何定义自己的数据集。各...
在ImageNet 1k数据集上训练CNN分类模型
ImageNet 1k数据集简介 ImageNet是CV领域非常出名的数据集，其中ISLVRC2012[http...
在ImageNet 1k数据集上训练yolov5m-cls分类模
ImageNet 1k数据集简介 ImageNet是CV领域非常出名的数据集，其中ISLVRC2012[http...

网友评论

本文标题：CV学习笔记（十九）：数据集拼接生成

本文链接：https://www.haomeiwen.com/subject/dqdbnhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|CV学习笔记（十九）：数据集拼接生成|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！