Task1 赛题理解

作者: 泥人冷风 | 来源:发表于2020-05-19 19:23 被阅读0次

NLP之新闻文本分类-Task1
cv街景门牌字符的赛题理解
Task1 赛题理解
nlp学习笔记-task1
贷款违约预测-Task1 赛题理解
NLP入门 - 新闻文本分类 Task1
Task 1赛题理解
nlp入门笔记——Task1 赛题理解
DataWhale二手车价格预测Task2-数据探索性分析EDA
DataWhale-计算机视觉实践（街景字符编码识别）--Tas

1. 理解赛题背景

零基础入门系列赛事第二场：零基础入门CV赛事之街景字符识别
典型计算机视觉识别：预测真实场景下的字符识别
引导入门方式-数据科学库、通用流程和baseline方案
有助于掌握数据竞赛基本技能，及数据建模

2. 赛题数据

基于SVHN原始数据，降低难度追加位置框的比赛用数据
下载json数据标签和zip图像的关系：

json数据标签

字段	含义
top	左上角坐标X
height	字符高度
left	左上角坐标Y
width	字符宽度
label	字符编码

zip图像

json数据对应图像位置

下载地址

特例：识别一张图片的多个字符的JSON标注：

原始图片	图片JSON标注数据格式
000000.png	json

3. 评测指标

Score=编码识别正确的数量/测试集图片数量

4. 读取数据

代码示例：

import json
train_json = json.load(open('../input/train.json'))

# 数据标注处理
def parse_json(d):
   arr = np.array([
       d['top'], d['height'], d['left'],  d['width'], d['label']
   ])
   arr = arr.astype(int)
   return arr

img = cv2.imread('../input/train/000000.png')
arr = parse_json(train_json['000000.png'])

plt.figure(figsize=(10, 10))
plt.subplot(1, arr.shape[1]+1, 1)
plt.imshow(img)
plt.xticks([]); plt.yticks([])

for idx in range(arr.shape[1]):
   plt.subplot(1, arr.shape[1]+1, idx+2)
   plt.imshow(img[arr[0, idx]:arr[0, idx]+arr[1, idx],arr[2, idx]:arr[2, idx]+arr[3, idx]])
   plt.title(arr[4, idx])
   plt.xticks([]); plt.yticks([])

5. 解题思路

赛题图像集特点如下：

字符属性	图片
字符：42 字符个数：2	42.png
字符：241 字符个数：3	241.png
字符：7358 字符个数：4	7358.png

难点

对不定长的字符进行识别(与传统的图像分类任务有所不同)

概括（三个方向）

简单入门思路：定长字符识别

关键点：固定长度，不足补X

专业字符识别思路：不定长字符识别

关键点：特定方法如-CRNN字符识别模型

专业分类思路：检测再识别

关键点：
--利用字符在图像中位置(训练集、验证集中)
--物体监测
--参考模型：SSD或者YOLO

6. 小结

本次赛题特点：

简单字符识别
多种解法（由浅入深）

网友评论

AI

本文标题：Task1 赛题理解

本文链接：https://www.haomeiwen.com/subject/prhiohtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Task1 赛题理解

1. 理解赛题背景

2. 赛题数据

json数据标签

zip图像

下载地址

[训练集]-3W

[验证集]-1W

[测试集A]-4W

[提交测试结果]-参考CSV

特例：识别一张图片的多个字符的JSON标注：

3. 评测指标

4. 读取数据

代码示例：

5. 解题思路

赛题图像集特点如下：

难点

概括（三个方向）

6. 小结

相关文章

NLP之新闻文本分类-Task1

cv街景门牌字符的赛题理解

Task1 赛题理解

nlp学习笔记-task1

贷款违约预测-Task1 赛题理解

NLP入门 - 新闻文本分类 Task1

Task 1赛题理解

nlp入门笔记——Task1 赛题理解

DataWhale二手车价格预测Task2-数据探索性分析EDA

DataWhale-计算机视觉实践（街景字符编码识别）--Tas

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

AI