图片文字转换成word技巧参考

时间:2012-05-19   作者:snow   来源:互联网

一、图片转换成word技巧

  这个,我们可能需要利用一些软件来实现了。在Office2003软件里面就已经自带了Document Imaging工具,有了它我们可以将文字“抠”出来。在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到Document Imaging中,在“工具”中选择“使用OCR识别文本”,Document Imaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。

        提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好。
        注意:许多朋友第一次使用,好像需要安装,安装的时候插入Office安装盘即可。
        如果安装不行的话,大家可以在网上找找其他的“文字识别系统”,貌似这类软件网上非常的多!

二、如何从图片中提取文字(怎样把JPG图片转换成word文档格式)

        1、把jpg转成tiff格式

        2、用office2003的office工具里面有个,document imagingOCR工具,一弄就ok了,非常方便(还有一个document scanning 工具是扫描完了直接出word的) 前提是office2003要安了那个工具,有的时候需要重新找一下安装文件。
        图片转换文字识别软件下载

三、Word文档页面转为图片(jpg)

最近要处理一项重复性的工作,就是把大量的word的文档转成jpg文件,要求:宽度900像素,清晰度高。首先考虑的是截屏,试了几个软件,但对滚动内容支持不好,大都可自动截取滚动内容,但文档页面两侧的区域也包含在里面,现在是最好只截取页面部分,其它不要。若采取手动截取,滚动就是个问题了,而且截取的区域大小不一。还有一种方法是把word文档先转成pdf,再用Adobe Reader等软件另存为jpg,再批量修改其宽度。摸索再三,我最终采取了以下方法,在效率上要比上种方法好些:

        1.新建word文档,设置页边距(设置成待转doc的页边距);

        2.将待转的doc文件拖入新建的word文档中;

        3.此时已自动生成word图片文件;

        4.点击打印按钮(需要安装一个虚拟打印机驱动程序);

        5.在弹出对话框选择另存为jpg文件;

        6.用FastStone Image Viewer批量转换(可设置宽度为900、增序文件名、图片质量等);

        说明:
        ①虚拟打印我找的是VirtualPrinter破解版;
        ②拖入word文档实际上是操作:插入|对象|由文件创建|待转换的doc文档;
        ③强烈推荐使用FastStone Image Viewer,速度快,效果不错!

如何将pdf格式文件转换成word,如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。 它能够将扫描的文字直接导入到WORD中进行编辑。

怎样将pdf转换成word

        第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

        第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

        情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件——>另存为——>把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。

        小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。Ny1

        情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。

发表评论