1、扫描文本在这个讲究效率的时代,我们都讲究用最快的速度来完成工作。在公司办公时,常常会遇到输入文字或者保存纸介文档的情况,如果是以前保存的文件,用快速的指法打一遍,也无疑会浪费许多时间!那么我们就可以选择扫描的方法来保存文字及文档。在这个数码设备日益流行的时代, 扫描仪不再是我们惟一的选择。下面就让我们来看看使用其他数码设备扫描文件的方法吧。扫描文档的流程要将纸介文件转换为电子文档,需要有硬件扫描设备、OCR 文本识别软件、文字排版软件。其要经过扫描、版面处理、文字识别、文字编辑几个阶段,下面我们就这几个阶段详述之。1、扫描的注意要点注意扫描时将图像保存设定为非压缩 TIFF 格式、PackBi
2、t、G4 压缩的 TIFF 格式、BMP 格式或 PCX 格式。另外还要根据扫描文件字体的大小合理设置扫描亮度及分辨率。2、对扫 描后的图像进行版面处理对扫描所得图像文件根据需要进行处理(旋转、反 转、剪裁、倾斜校正、版面分析等等),为识别做好充分准备 。要选择进行文字识别的区域,如果不选择, 则认为是对整篇图像进行识别。在对整篇图像进行识别时,当然识别区域中不能包含有插图( 如有插图另外处理)。3、进行文字 识别一般 OCR 文字识别软 件都有“识别”按钮 ,你按下这个按钮系统便会自动进行识别的。4、文字编辑处理识别结果经修改编辑后,可根据需要通过复制输出到其他应用程序中(如 Word XP
3、、WPS2000 等),也可直接存盘。在文字编辑过程中我们会使用到文字编辑软件强大的替换和中文校对功能。例如,比如删除回车符是一件比较头痛的事情。我们可以巧妙利用替换来轻松删除所有回车符。Word 2000 后台简体中文校对也很实用,在确信有错误的中文词语下面,将显示红色的波形下划线;在不能确定是否有误但强烈建议你仔细检查的中文词语下面,将显示绿色的波形下划线。这样也可以帮助你省去不少校对的苦差使。利用扫描仪进行识别使用扫描仪是常用的选择,要保证其正常使用。首先选择合适的扫描分辨率:不求最“高 ”,只求最 “佳”。根据经验,普通五号印刷体采用 250300dpi 比较合适;若字号比较大(四号以
4、上),用 150200dpi就足够了;如果是六号或七号字,就要考虑使用 400600dpi 了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔画较多的识别文本,应适当提高扫描的分辨率。提供一个公式供参考:文件长度( 字节)=(水平尺寸 垂直尺寸 扫描分辨率)/8 。在 购买扫描仪,最好选择具有批量扫描功能的扫描仪,如此一来你只要将待扫描的文件准备好,然后去干别的事,过了一阵子你就可以得到批量保存的图像了。在购买扫描仪时,其都会配给你原装的 OCR 识别软件。只要你能合理使用,扫描是轻而易举的。由于 OCR 软件在扫 描并转换文件时起着很重要的作用,所以在后面有单独介绍。利用 数码相机进行识
5、别数码相机给人的感觉往往就是拍照片,从某种意义上说,扫描也就是拍照片。说得通俗一点,将报纸或者杂志拍成电子图像,然后由中文识别进行识别也不失为一种好方法!市场上多数数码相机都提供了 Text(文字) 拍摄功能,我们就利用此功能来实现文字的录入。选择好合适的相片分辨率(即尺寸大小),同时,为提高所拍摄文本图像的清晰度,另外还要开启相机的微距拍摄功能,并调整好光源和曝光补偿等。为保证拍摄效果,避免图像整体明暗不均,最好禁用内置闪光灯。在进行 OCR 识别 之前,我 们最好先将拍好的文字照片用 Paint shop pro 等图像编辑软件对它的对比度进行一定的调节。使照片中的文字与背景尽可能的突出。
6、这样便可以将报纸的纸张背景变为纯白,而文字变得更黑更加突出,有利于后面 OCR 软件的识别。对于没有OCR 识别软 件的朋友来 说,可以去互联网上下载一款丹青中文文字辨识软件,其大小仅为 2MB 左右,由于其只支持 TIF、PCX、BMP 格式。故假如您的数码相机没有这三种图像格式的,可以使用 ACDSee软件将图片格式转换一下。常见 OCR 界面利用传真机Modem 识别不少公司都有传真机和 调制解调器,只要巧妙搭配就可以实现扫描文字的功能。首先将传真机的 Phone 口接上公司内部电话,这样可以节省电话费,如果使用固定电话长时间扫描电话费可不菲。然后将公司的电脑接上 Modem 并连上一根
7、内部电话线,并且安装上一款名为 Bitware 的软件。然后开启 Modem,打开 Bitware 软件,使之处于传真接收状态。然后启动传真机,拨 Modem 所接的电话号码。然后Modem 便会自动应答,您就可以将 Bitware 所接收下来的传真文件存为图像格式。如此一来我们就可以使用 OCR 识别软件来进行文本转换。Bitware 软件界面除了上述几种方法外,笔者还尝试过使用 USB 摄像头进行文本识别。因为笔者使用的摄像头是 352288 的分辨率,故文字基本上一片模糊。假如您的 USB 摄像头分辨率高一些的话,不妨也尝试一下了。不过用 USB 摄像头进行文字扫描只不过是“玩玩” ,要获得高效的扫描还是使用专业扫描仪或者数码相机好一些。打个形象的比方,数码相机就好比是一只移动扫描仪。假如您带着一只数码相机去图书馆,您看中了哪些资料就可以不用花钱复印了。只要拍下来,然后带回家轻松 OCR 一下。那些资料就存在你的电脑中了。