绿色圃中小学教育网

 找回密码
 免费注册

QQ登录

只需一步,快速开始

查看: 80260|回复: 1
打印 上一主题 下一主题

怎么把.JPG图片格式转换成WORD文档文字版

[复制链接]
跳转到指定楼层
楼主
发表于 2012-11-21 23:38:23 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
怎么把.JPG格式图片转换成WORD文档文字版
· Office在2003版中增加了Document Imaging工具,· 用它可以把文字给“抠”出来
1.把JPG文件另存为TIFF-TAG图像文件格式(可用ACDSee软件)
2.在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,·
3.文件-· 》打开,· 选择想要提取文件的图片,·
4.在“工具”中选择“使用OCR识别文本”,· Document Imaging的OCR识别程序就会对图片进行识别,· 完成后
5.选择“工具”中的“将文本发送到Word”,· 程序会自动打开Word文档,· 展现在你面前的就是从图片中“抠”出来的文字。
提示:一般而· 言,· 识别的准确率可以达到95%以上,· 但对英文和数字的识别不· 是太好
其它软件
一、汉王
感觉比紫光好,· 可以识别表格,· 新版汉王5800,· 还没有装。
二、清华紫光
以前7.5用过很多次,· 基本还可以,· 文科类书籍识别还不· 错,· 新版紫光9.0,· 应该有提高
三、慧视小灵鼠
号称很厉害,· 用手机拍得都行。
四、尚书
有表格识别,· 大概很中庸,· 用的人不· 多。
五、丹青
能识别繁体
六、cajviewer 6.0
不· 是专用识别软件,· 内部应该是汉王的核心。
七、Microsoft Office Document Imaging
八、FineReader v7.0 Professional
据说很牛的英文识别软件,· 是俄国人搞的,· 天空软件有下,· 汉字也有,· 只是没有地方下到。
九、ABBYY
e文识别。
十、TextBridge
e文识别
· 首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去,· 一般单位都有扫描仪,· 如果没有也没关系,· 用数码相机拍也行,· 拍成图片放到WORD里面去,· 不· 过在些之前,· 你还得装一下WORD自带的组件,· 03和07的都行。点开始-程序-控制面板-添加/删除程序,· 找到Office-更改-添加或删除功能,· 然后下一步,· 注意一定要勾选上“选择应用程序的高级自定义”-下一步,·  单击office工具-找到Microsoft Office Document Imaging 这个组件,· Microsoft Office Document Imaging Writer 点在本机上运行,· 单击更新然后按步骤操作就可以了。
首先将扫描仪安装好,· 接下来从开始菜单启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。   
提示:Office 2003默认安装中并没有这个组件,· 如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。由于是文字扫描通常我们选择“黑白模式”,· 点击扫描,· 开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式”,· 建议分辨率为300dpi。扫描完毕后回将图片自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。   
点击工具栏中的“使用OCR识别文字”按键,· 就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。如果你要获取部分文字,· 只需要用鼠标· 框选所需文字,· 然后点击鼠标· 右键选择“将文本发送到Word”就将选中区域的文字发送到Word中了。
此软件还有一小技巧:通过改变选项里的OCR语言,· 可以更准确的提取文字。例如图片里为全英文,· 把OCR语言改为“英语”可以确保其准确率,而· 如果是“默认”则最终出现的可能是乱码~
还有:
应该说,· PDF文档的规范性使得浏览者在阅读上方便了许多,· 但倘若要从里面提取些资料,· 实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译,· 痛苦的要命,· 竟然傻到用Print Screen截取画面到画图板,· 再回粘到word中,· 够白了:(最近连做几份商务标· 书,· 从Honeywell本部获取的业绩资料全部是英文版的PDF,· 为了不· 再被折磨,· 花费了一个晚上的时间研究PDF和Word文件的转换,· 找到下面2种方法,· 出于无产阶级所谓的同· 甘共苦之心,· 共享下:)
1、实现工具:Office 2003中自带的Microsoft Office Document Imaging
应用情景:目前国外很多软件的支持信息都使用PDF方式进行发布,· 如果没有Adobe Reader,· 无法查看其内容,· 如果没有相关的编辑软件又无法编辑PDF文件。转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为 DOC的工作,· 但很多都不· 支持中文,· 我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。
  使用方法:
  第一步:首先使用Adobe Reader打开待转换的PDF文件,· 接下来选择“文件→打印”菜单,· 在打开的“打印”设置窗口中将“打印机”栏中的“名· 称”设置为“Microsoft Office Document Image Writer”,· 确认后将该PDF文件输出为MDI格式的虚拟打印文件
  编辑提示:如果你在“名· 称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,· 那证明你在安装Office 2003的时候没有安装该组件,· 请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。
  第二步:运行Microsoft Office Document Imaging,· 并利用它来打开刚才保存的MDI文件,· 选择“工具→将文本发送到Word”菜单,· 并在弹出的窗口中勾选“在输出时保持图片版式不· 变”,· 确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,· 不· 管它,· 确认即可。
编辑提示:目前,· 包括此工具在内的所有软件对PDF转DOC的识别率都不· 是特别完美,而· 且转换后会丢失原来的排版格式,· 所以大家在转换后还需要手工对其进行后期排版和校对工作。
2、实现工具:Solid Converter PDF
  应用情景:利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换,· 但是对于很多“不· 规则”的PDF文档来说,· 利用上面的方法转换出来的Word文档中常常是乱码一片。为了恢复· PDF的原貌,· 推荐的这种软件可以很好地实现版式的完全保留,· 无需调整,而· 且可以调整成需要的样板形式。
使用方法:
  1、下载安装文件Solid Converter PDF,点击安装。
编辑提示:安装前有个下载安装插件的过程,· 因此需要保证网络连接通畅。
  2、运行软件,· 按工具栏要求选择需要转换的PDF文档,· 点击右下的“转换”(Convert)按扭,· 选择自己需要的版式,· 根据提示完成转换
· 只能用OCR文字识别软件,· 推荐紫光OCR,· OCR软件识别后变成纯文本,· 可以粘贴到word就可以编辑了

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享 顶 踩
回复

使用道具 举报

沙发
发表于 2014-6-24 15:51:14 | 只看该作者
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

绿色圃中小学教育网 最新主题

GMT+8, 2024-11-29 06:32

绿色免费PPT课件试卷教案作文资源 中小学教育网 X3.2

© 2013-2016 小学语文数学教学网

快速回复 返回顶部 返回列表