美文网首页
批量图片识别 Umi-OCR v1.3.6 中文绿色版

批量图片识别 Umi-OCR v1.3.6 中文绿色版

作者: 小虾米的互联网江湖 | 来源:发表于2023-10-09 17:24 被阅读0次

    介绍

    Umi-OCR用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

    软件截图

    软件特点

    忽略区域功能

    忽略区域是本软件特色功能。可用于批量识别视频截图时排除右上角水印的干扰,批量识别游戏截图时排除UI与按钮的干扰,让识别结果只留下干净的台词文本。

    “忽略区域”是指图片上指定位置与大小的矩形区域,完全处于这些区域内的文字块,将被排除。

    点击 设置 选项卡中的 添加忽略区域 ,进入忽略区域选择窗口。

    将任意图片 拖入 该窗口,可预览该图片。将新图片拖入窗口可切换预览,但已绘制的忽略区域不会消失;可切换不同图片来仔细调整忽略区域。

    绘制 忽略区域 :拖入图片后,点击选中左起第一按钮 +忽略区域 1 ,然后在图片上按住左键拖拽,绘制矩形区域。可 撤销 步骤。

    绘制完后,点击 完成 返回软件主窗口。若不想应用此次绘制,则右上角X,取消。

    本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用过程中无需联网。支持更换Paddle官方模型(v2.x版本)或自己训练的模型,支持修改PaddleOCR参数。通过添加不同的语言模型,软件可识别多国语言。

    更新日志

    v1.3.6 主要更新:

    • 优化了段落合并的功能:
      • 单行 方案的文本排序更准确。
      • 多行-自然段 方案更加智能,支持自动判断中/英文段落,采取不同的合并规则。
      • 新增多行-代码段方案,支持还原图中的缩进与空格,适合用来识别代码片段。
      • 移除了 西文左对齐模糊匹配等方案,它们可以用现有方案代替。
    • 功能调整:截图联动 划分为独立的功能,以单独快捷键触发,不受常规截图OCR影响。

    批量图片识别 Umi-OCR v1.3.6 中文绿色版 (2243)

    相关文章

      网友评论

          本文标题:批量图片识别 Umi-OCR v1.3.6 中文绿色版

          本文链接:https://www.haomeiwen.com/subject/ugiibdtx.html