Quote:
引用第6楼dhwch于2007-05-19 19:35发表的 :
因为你的PDF文档是扫描的,所以无法***文字内容,只能是图片形式
这个正解。可以用office。
安装office2003,并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件(包括mdi和tiff两种格式,默认为msi),并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到Word”,最后将把整个PDF文件识别输出到Word文件中。如果上面“打印”成的格式是tif,则需要手动从“开始”菜单“Microsoft Office 工具”中启动Microsoft Office Document Imaging,然后再“打开”tif文件,同样可以把文字识别到Word中。
=====================
或者使用ocr识别工具,前一段下了Readiris Pro 11 Corporate Edition,感觉效果还可以。