9512.net
甜梦文库
当前位置:首页 >> >>

巧用Office虚拟打印机,轻松转换超星PDG格式电子书为word



巧用 Office 虚拟打印机,轻松转换超星 PDG 格式电子书为 word 超星是支持 OCR 文字识别功能的。点击工具栏“T”样的图标,再选中一页的内容, 就能把文字识别出来。

只是超星程序员的功夫还没练到家。比较下面两段内容: ‘遁币不见”是一个令人惊异的小节日,表演者将白色手巾平滩在桌上.在手巾省 小放——枚硬币(图 9—17).将手巾的一角提起,折

过来遮住硬币,将手巾其余 的二角也递次折拢,请一位观众伸出食指,阴着手巾按一铵、那硬 m 还在于巾之 中(团 9—18)c、表演者说一声“去”!提起子巾,那 52 币就 秘诀与准备工作 第六节 遁币不见 一、表演效果 “遁币不见”是一个令人惊异的小节目, 表演者将白色手巾平摊在桌上, 在手巾当, l ‘放一枚硬币(图 9 一 17 ) ,将手巾的一角提起,折过来遮住硬币,将手巾 其余的三角也递次折拢,请一位观众伸出食指,隔着手巾按一按,那硬币还在手 巾之中(图 9 一 18 ) ,、表演者说一声“去”!提起一手巾,那硬币就踪迹不见, 抖一抖,手巾中已没有任何东西了(图 9 一 19 )。 二、秘诀与准备工作 上面这两段内容分别是用超星和 MS OFFICE 2003 的虚拟打印机(Microsoft Of fice Document Imaging)的 OCR 文字识别功能识别的一页内容。智商高的人第 一段也能看懂,我不行,呵呵!我们要做的就是把超星一本书的内容用虚拟打印 机“打印”成图片,再用 OCR 识别出来。这样阅读和打印起来都比较方便。 预备工作:

只有 2003 版的 OFFICE 才自带有虚拟打印机,所以,首先你要在机器上装了 Of fice2003。装好后,在“控制面板”-->“打印机和传真”里,我们能看到一台名为 “Microsoft Office Document Imaging”的打印机。

我们开始工作了! 第一步 魔术》。 打开后,点击左面栏“章节目录”,在下拉框中选择“页列表模式”,这样我们能知 道要打印多少页。如图。 当然是先把超星的书下载回来, 我下载了一本 《中国艺术经典全书--

第二步:打印设置 选择“图书”-->“打印”,弹出“打印设置”窗口,设置打印页数和方式。我们只打 印目录页和正文页,共 137 页。其它使用默认设置。如图:

在弹出的“打印”窗口中,选择微软的虚拟打印机,勾选“打印到文件”复选框。输 出路径可以在“首选项”按钮的“高级”选项卡中设定。打印的生成的文件的扩展名 是.mdi。

注意:超星会检测打印名称中是不是含有“image”,“office"等字样,若有,就拒 绝打印。所以我们要把打印机的名字改一下。上图中的“超星打印机”就是 Micro soft Office Document Imaging 打印机。 第三步:执行 OCR 识别功能 打印完成后,文件将自动打开。

大致浏览一下,把空白页和图片太多的页删掉。然后在工具栏点击 word 样的图 标,弹出“将文本发送到 WORD”窗口,直接确定,MS Office Document Imaging 便开始执行文字识别功能,并将识别的内容写入与打印文件相同目录下的同名 w ord 文档。

文字识别执行完成后文档自动打开。 这里打开的是一个网页文件, 我们将其另存 为.doc。 生成的文件中有乱码是必然的。在排版复杂或图片多的文件中尤其如此。OCR 会 努力把图片当成文字来识别(呵呵,挺用功的~)通常我们需要要把文中多余的 空格和回车删掉。最后,把乱码修改一下,OK,大功告成! 如果灵活应用,应该会给学习,生活和工作带来很大便利.



更多相关文章:
利用PdfFactory虚拟打印机实现Word文档和PDF格式文件的...