Umi-OCR 下载 - 免费离线OCR工具,安全精准文字识别
Umi-OCR 是一款免费、开源、高效的OCR(光学字符识别)工具,基于 PaddleOCR 和 RapidOCR 引擎,支持多种语言的文字识别,并提供了丰富的功能选项。其最大的特点是完全离线运行,无需联网即可使用,有效保障了用户的数据隐私和安全。此外,它的界面直观,操作简单,即使是小白也能快速上手,故在此推荐。本文提供 Umi-OCR 官方原版绿色版,无需安装,下载解压后即可使用。
一、功能亮点及优势
1. 免费开源,无成本使用。Umi-OCR 遵循 MIT 开源协议,所有代码公开,用户无需支付任何费用即可使用,无需担心版权问题。不仅为个人和小型团队节省了软件购买成本,同时也为开发者提供了学习和二次开发的机会。
2. 离线运行,不受网络限制。在没有网络连接的环境中,Umi-OCR 依旧能正常工作。只需下载并解压软件包,无需依赖网络进行识别,避免了无网络导致无法使用的情况,同时也保护了个人隐私。
3. 高精度文字识别。默认采用 PPOCR-v3 模型库,对常规文字、手写文字、方向不正和杂乱背景下的文字都有较高的识别准确率。通过设置忽略区域,能有效排除水印、UI 元素等干扰,提取干净的文本;利用文块后处理功能,可根据不同场景选择合适的排版方案,如单行、多行 - 自然段、多行 - 代码段、竖排等,使识别结果更加规整,便于阅读和使用。
4. 批量处理,高效便捷。可批量导入图片进行文字识别,一次性处理大量图片,大大提升工作效率。支持格式包括 jpg、jpe、jpeg、jfif、png、webp、bmp、tif、tiff。用户可以将图片或整个文件夹直接拖入软件,识别结果可保存为 txt、jsonl、md、csv(Excel) 多种格式文件。还能在任务完成后选择自动关机或待机,减少人工操作,实现自动化处理。
二、使用方法与技巧
1. 截图识别。点击截图按钮或使用自定义快捷键即可唤起截图识别功能。截图后可生成预览窗口,该窗口能置顶或设置为半透明,方便用户对比原图和识别结果。
2. 粘贴识别。在任何地方复制图片后,只需在软件中点击粘贴按钮或使用快捷键,就能自动进行识别,操作简单快捷,适用于从网页、聊天工具等获取图片并识别文字的场景。
3. 批量识别本地图片。将图片或文件夹拖入软件,或者通过点击按钮打开浏览窗口导入,软件会自动识别并将结果保存到本地,满足用户对大量图片文字提取的需求。
对于含有水印、UI 元素等不需要识别内容的图片,Umi-OCR 的忽略区域功能十分实用。用户可在设置选项卡中打开忽略区域编辑器,将图片拖入后绘制矩形区域,处于这些区域内的文字块将不会被识别输出。比如处理视频截图时,能轻松排除水印干扰;对于游戏截图,可根据不同类型图片的特点,分别设置忽略区域排除 UI 元素,准确提取所需文本。
三、常见问题与解决方法
1. 无法启动引擎。若遇到无法启动引擎的问题,可能是 CPU 不支持 AVX 指令集,可通过 CPU-Z 软件查看。此时可尝试换用 RapidOCR 引擎。
2. 多屏幕截图不正常。当外接多块屏幕且缩放比例不一致时,Umi-OCR 内置截图模块可能出现异常。可通过将所有屏幕缩放比例调为相同数值、切换到软件附带的调用 windows 内置 “截图和草图” 的截图方案(确保系统截图功能正常且自动复制到剪贴板开关打开)、禁用软件的 DPI 缩放(右键 Umi-OCR 文字识别.exe,在属性 - 兼容性 - 更改更高 DPI 设置中勾选替代高 DPI 缩放行为)等方法解决。
3. 未找到引擎组件。若提示未找到引擎组件,需将 PaddleOCR-json 文件夹放置于程序入口(main.py 或 exe)同目录下。
四、版本选择与下载
不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。
1. Paddle 引擎插件版
性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU。重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。
2. Rapid 引擎插件版
速度稍慢,内存占用低,适合低配机器,兼容性好。