如何从图片中提取文字
现在许多网站都有EXE、CHM、PDF等格式的电子书下载。很多时候这些电子书可以看,但是其中的内容却不能***。如果我们需要这些电子书中的文本内容,是不是就非得要重新输入一遍呢?当然不用这么麻烦。下面我就告诉大家如何将这些内容从资料中提取出来。
Snaglt文字提取
Sn.agIt是一款功能强大的图片捕 捉工具,但是很多朋友可能不知道,它 还有文字捕捉的功能,能将文字从图片中提取出来。目前它的最新版本为7.O。启动SnagIt 7.O,在左侧选中“窗口文字”(如图),在左侧选择输入位置(比如屏幕、区域、窗口等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文字的文件窗口,按下“捕获”快捷键,即可将文字提取出来。
此时我们会发现提取的文字中有很多空格或出现段落错乱等情况,这时我们可以用文字编辑工具进行重新编排。这里以WPS Offi.ce 2003为例:将提取文字***粘贴至新文档中,依次选择菜单“工具”→“文字”下的 “段落重排”→“删除段首空格”→“删除空段”命令,这时文章已经变得很整齐了。
文字识别工具
文字识别工具简称OCR工具。这里我们以清华紫光OCR文字识别工具为例。打开带有文字的图片(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片),根据所要提取的文字进行裁剪。启动OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别"按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果***粘贴至其他文档中即可。
一个非常优秀的屏幕、文本和视频捕获与转换程序. 可以捕获Windows屏幕、DOS屏幕; RM电影、游戏画面; 菜单、窗口、客户区窗口、最后一个激活的窗口或用鼠标定义的区域. 图象可被存为BMP、 PCX、TIF、GIF或JPEG格式, 也可以存为系列动画. 使用JPEG可以指定所需的压缩级(从1%到99%). 可以选择是否包括光标, 添加水印. 另外还具有自动缩放, 颜色减少, 单色转换, 抖动, 以及转换为灰度级. 此外, 保存屏幕捕获的图象前, 可以用其自带的编辑器编辑; 也可以选择自动将其送至SnagIt打印机或Windows剪贴板中, 也可以直接用E-mail 发送.
SnagIt具有将显示在Windows桌面上的文本块转换为机器可读文本的独特能力, 这里甚至无需CUT和PASTE. 程序支持DDE, 所以其他程序可以控制和自动捕获屏幕. 支持输出到外部程序或IM(即时通讯)软件、导入/导出属性. 7.2版本增强了web捕捉功能, 可以捕捉自定义后缀的文件类型; 改进了基于任务的自带编辑器; 增强了打印中的页面设置功能; 增加了与windows结合, 嵌入资源管理器单击右键菜单中, 甚至可以设为默认图片编辑器方便快捷地使用.(内附注册机)
Name:
www.orsoon.comCode:FHGAY-AMCCH-CFLCC-DCCDL-55599
下载地址:
http://www.orsoon.com/Software/catalog116/2224.html