OCR(光学字符识别)扫描 告别大文件的烦恼
作者: CBISMB编辑
责任编辑: 阚智
来源: 中小企业IT采购
时间: 2008-11-29 10:27
关键字: 扫描
浏览: 0
点赞: 0
收藏: 0
借助 OCR(光学字符识别)扫描,你能将纸质文件扫描成计算机文本文件,用文字处理程序或文本编辑器打开。OCR 扫描可助你迅速实现纸质文件数字化,对它们进行编辑、通过电子邮件发送、存档,不需要将内容手动输入到文字处理文件。
如今,OCR 软件的发展已经使扫描活动已成为所有高效工作场所的重要组成部分。优点:
OCR 节省空间。 减少大文件数量。纸质文件被易于存储的数字文件所取代。
OCR 节省时间。 无需重新输入冗长的文件。而且,在存档和检索文件时,你只需设置和维护统一的命名和存档规则即可轻松完成。
OCR 免除后顾之忧。 你可制作并存储重要文件的数字备份。不管你的办公室处于飓风区、洪涝区或火灾高发季节,当天灾降临时这将确保最重要的文件不会丢失。
正确的设置
专用的 OCR 软件可将打印文字转换成数字文本。许多扫描仪都配备 OCR 软件,您也可以购买第三方软件,如 ReadIRIS。以下建议可帮助你充分发挥 OCR 软件的功能。首先我们从理想的 OCR 扫描设置入手。
文件格式。 TIFF、BMP 或 JPEG 是首选格式。TIFF 的压缩率较低,但是如果使用合适的颜色和分辨率设置,就能有效减少这些文件的大小。如果机器资源紧张,可使用 BMP 或 JPEG 格式。
分辨率。 选择较低的分辨率,如 150 dpi,不仅省时,也便于文件操作。
色彩。 扫描文件一般不需要色彩。使用 256 灰阶(8 位)或黑白扫描。
充分发挥 OCR 功能的其它技巧
质量。 务必选用高质量的原件。撕裂、折皱和脏物会影响 OCR 软件的识别,导致最终输出错误。使用修正液处理弄脏的原件,或使用复印件提高原件的对比度。
简便性。 OCR 软件一般最适用于大量整洁文本的扫描,因为无需考虑符合布局、分列或分行的要求。
参数。 扫描多列页面的文本也很简单。OCR 软件程序一般可以指定页面文本的扫描区域。如果将每一列指定为单独的文本区域,OCR 将先扫描第一列,然后是第二列,依此类推。
安全检查。 某些文本可能会给 OCR 软件的使用带来一些问题。下划线、粗体或斜体文字可能造成扫描仪无法识别字符。连体文本或紧密文本(字母间空格经过调整,以节省空间)也会给 OCR 程序带来麻烦。因此,校对很重要。拼写检查不可能发现所有的错误。
更多安全检查。 对软件无法识别的字符进行标注 - 大多数 OCR 程序提供此项功能,也能帮助你节省时间,避免麻烦。这样做能为校对工作提供方便。
事先进行尝试性扫描。 如果要扫描大型文件,可以先试扫第一页,然后再完成全部文件输出操作。这有助于您及时发现并解决错误。
设备。 处理器和扫描仪速度越快,等候时间就越短。基本功能(如区分图像与文本、识别文字、把文件布局转换成电子格式)至少需要 32MB RAM(当然越高越好)。此外,如果您需要一次扫描多页,最好购置自动文档进纸器 (ADF)。
如今,OCR 软件的发展已经使扫描活动已成为所有高效工作场所的重要组成部分。优点:
OCR 节省空间。 减少大文件数量。纸质文件被易于存储的数字文件所取代。
OCR 节省时间。 无需重新输入冗长的文件。而且,在存档和检索文件时,你只需设置和维护统一的命名和存档规则即可轻松完成。
OCR 免除后顾之忧。 你可制作并存储重要文件的数字备份。不管你的办公室处于飓风区、洪涝区或火灾高发季节,当天灾降临时这将确保最重要的文件不会丢失。
正确的设置
专用的 OCR 软件可将打印文字转换成数字文本。许多扫描仪都配备 OCR 软件,您也可以购买第三方软件,如 ReadIRIS。以下建议可帮助你充分发挥 OCR 软件的功能。首先我们从理想的 OCR 扫描设置入手。
文件格式。 TIFF、BMP 或 JPEG 是首选格式。TIFF 的压缩率较低,但是如果使用合适的颜色和分辨率设置,就能有效减少这些文件的大小。如果机器资源紧张,可使用 BMP 或 JPEG 格式。
分辨率。 选择较低的分辨率,如 150 dpi,不仅省时,也便于文件操作。
色彩。 扫描文件一般不需要色彩。使用 256 灰阶(8 位)或黑白扫描。
充分发挥 OCR 功能的其它技巧
质量。 务必选用高质量的原件。撕裂、折皱和脏物会影响 OCR 软件的识别,导致最终输出错误。使用修正液处理弄脏的原件,或使用复印件提高原件的对比度。
简便性。 OCR 软件一般最适用于大量整洁文本的扫描,因为无需考虑符合布局、分列或分行的要求。
参数。 扫描多列页面的文本也很简单。OCR 软件程序一般可以指定页面文本的扫描区域。如果将每一列指定为单独的文本区域,OCR 将先扫描第一列,然后是第二列,依此类推。
安全检查。 某些文本可能会给 OCR 软件的使用带来一些问题。下划线、粗体或斜体文字可能造成扫描仪无法识别字符。连体文本或紧密文本(字母间空格经过调整,以节省空间)也会给 OCR 程序带来麻烦。因此,校对很重要。拼写检查不可能发现所有的错误。
更多安全检查。 对软件无法识别的字符进行标注 - 大多数 OCR 程序提供此项功能,也能帮助你节省时间,避免麻烦。这样做能为校对工作提供方便。
事先进行尝试性扫描。 如果要扫描大型文件,可以先试扫第一页,然后再完成全部文件输出操作。这有助于您及时发现并解决错误。
设备。 处理器和扫描仪速度越快,等候时间就越短。基本功能(如区分图像与文本、识别文字、把文件布局转换成电子格式)至少需要 32MB RAM(当然越高越好)。此外,如果您需要一次扫描多页,最好购置自动文档进纸器 (ADF)。
©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。