VovSoft OCR Reader是一款直观且高效的图像到文本转换程序,专门设计用来从PDF、PNG、JPEG、TIFF、WEBP和BMP文件中提取文字,依托于先进的光学字符识别(OCR)技术。该软件支持批量处理多页PDF文件,非常适合需要高效转换大量文档的用户。与在线OCR工具相比,VovSoft OCR Reader最大的优势是完全离线操作,确保了用户隐私数据的安全,因为它在任何情况下都不会将图像文件发送至互联网。
该OCR工具体积小巧,轻量级,能轻松将图像文件和扫描的文档数字化,非常适用于笔记本电脑或台式电脑。它支持TWAIN和WIA扫描仪协议,使用Tesseract OCR引擎扫描文档,该引擎支持100多种语言,并采用基于神经网络(LSTM)的OCR引擎增加准确性,不仅可以进行行识别,还可识别字符模式。
除此之外,VovSoft OCR Reader还能识别文档中的特定区域,用户只需通过鼠标点击和拖动在图像上创建一个矩形选择框,这样程序就会仅转换选定的区域,以提供更精确的转换并加速处理过程。简洁的用户界面设计和有限的选项旨在使操作尽可能简单,支援多种输出格式,包括TXT、DOC/DOCX以及PDF文件,无论是安装版还是便携版,VovSoft OCR Reader的应用均方便快捷。
从图像软件中提取文本
Vovsoft OCR Reader是一款图像到文本转换器程序,允许您使用光学字符识别从 PDF、PNG、JPEG、TIFF、WEBP 和 BMP 文件中提取文本。该软件基本上是图像文本阅读器。它支持多页PDF文件的批量处理。
虽然网上有许多 OCR 工具可用,但有些人更喜欢专用的桌面工具。该程序最好的部分是转换完全离线完成。您是您的私人数据的唯一控制者。在任何情况下都不会将图像文件发送到互联网。
数字化扫描文档
这款小巧轻便的 OCR 工具可以轻松地将笔记本电脑或台式电脑上的图像文件和扫描文档数字化。它可以使用 TWAIN 和 WIA 扫描仪协议扫描文档。该应用程序使用 Tesseract OCR 引擎,支持 100 多种语言。为了提高准确性,它使用基于神经网络 (LSTM) 的 OCR 引擎,该引擎提供线条识别,而且还可以识别字符模式。
识别特定区域
您可以创建一个选择框来识别文档中的特定区域。为此,您所要做的就是单击图像并拖动鼠标以创建一个矩形。因此,程序将裁剪您选择的区域。这将提供更准确的转换并加快过程。
支持的 OCR 语言
训练的模型包括:阿拉伯语、孟加拉语、保加利亚语、中文(简体)、中文(繁体)、捷克语、丹麦语、英语、法罗语、法语、德语、希腊语、希伯来语、印地语、匈牙利语、意大利语、日语、韩语、老挝语、拉脱维亚语、波斯语、波兰语、葡萄牙语、旁遮普语、罗马尼亚语、俄语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语、乌尔都语、越南语
该程序既可以作为安装程序也可以作为便携式 OCR 提供,可以随身携带并在需要时随时随地使用。它具有简单的界面和最少的选项。换句话说,GUI 的目的是不复杂,以便尽可能简单地使用。您可以将识别的文本保存为 UTF-8 编码的 unicode 纯文本 (TXT)、Microsoft Word 文档 (DOC/DOCX) 或 PDF 文件。
VovSoft OCR Reader主要特征
- 复选标记PNG 转文本
- 复选标记JPEG 到文本
- 复选标记JPG 转文本
- 复选标记TIFF 转文本
- 复选标记WebP 转文本
- 复选标记BMP 转文本
- 添加了“加载剪贴板图像”
- 添加了“搜索”(在 Google 上)
- 添加了“应用对比度增强”
- 添加了“应用降噪”
- 添加“转换为黑白”
- 添加了“转换为灰度”
- 添加“降低亮度”
- 添加“增加亮度”
- 添加“向右旋转 90°”
- 添加“向左旋转 90°”
- 添加“旋转 180°”
- 添加“垂直翻转”
- 添加“水平翻转”
- 支持旁遮普语
- 支持加载多页PDF文件
- 支持波斯语、斯洛文尼亚语
- 改进的文本字段
- 改进的错误消息
- 添加了 WEBP 和 PDF 示例文件
- 支持孟加拉语、丹麦语、法罗语、匈牙利语、老挝语、拉脱维亚语、斯洛伐克语、泰语
- 支持 PDF 和 DOC/DOCX (Microsoft Word) 导出
- 支持的扫描仪(Twain 和 WIA)
- 支持的选择框
- 支持的 WEBP 图像文件
- 支持拖放
- 应用程序显示经过的时间(以秒为单位)
评论(0)