你好,游客 登录 注册 搜索

背景:
阅读内容

三步法“攫取”文本信息

[日期:2018-03-08] 来源:  作者:山东 杨鑫芳 [字体: ]

 

  文本信息的获取可以说是收集各种多媒体信息操作中最为容易的~种,在很多情况下都是通过直接拖动选中后复制、粘贴即可实现。但是,当我们遇到那些做了防澳门注册送彩金网址处理的网页时(不响应鼠标的拖动操作),或是防二次编辑的PDF文档,甚至是有些网页一拖动选中就会出现各种随机干扰码……此时,推荐大家试一下三步法“攫取”文本信息,只须使用新用户注册送59元彩金上所安装的常规软件即可轻松实现。
  
  【第一步】用QQ进行屏幕截图以某PDF文档为例,在已经运行了腾讯QQ的前提下,首先直接按CTRl-Alt-A组合键在打开的PDF文档页面中进行鼠标拖动来屏幕截图——使用组合键的好处是不必打开任何一个聊天窗口且操作十分快捷;调节好待截取的屏幕区域后,再点击右下角的“完成”按钮,这样就将该区域图像内容进行了复制操作。
  
  【第二步】用OneNote的“复制图片中的文本”进行文本识别运行OfiICe组件中的OneN6ce,直接按Ctrl-V组合键进行粘贴操作,界面中就会出现上一步使用QQ屏幕截图功能复制出来的PDF文档图片内容;接着,在该图片上点击鼠标右键选择“复制图片中的文本”项,此时并未有任何操作提示但已经初步“攫取”出了文本信息。
  
  【第三步】用Word“替换为”整理格式新建一个Word文档,仍然是按Ctrl-V组合键进行粘贴操作,之前在PDF中所看到的文本信息立刻就会出现(OneNote的文本识别率是相当高的),但还有两个小问题需要解决:~是相邻文字间都有个半角空格,二是几乎每一行信息最后都有垂直向下的软回车箭头和硬回车,这都要通过Word“替换为”功能来整理。
  
  1.处理半角空格首先,选中任意两个文字间的空格并按Ctrl-C组合键复制;然后,再按Ctrl-H组合键弹出“查找和替换”一“替换”对话框:在“查找内容”处按Ctrl-V组合键将刚刚复制的半角空格进行粘贴,下方的“替换为”处保持不变;最后,点击“全部替换”按钮,Word就会提示“全部完成。完成331处替换。”,点击“确定”按钮将它关闭,我们就得到了一行行整齐排列但行末仍带有软回车的文本信息。
  
  2.处理软回车和硬回车仍是按Ctrl-H组合键弹出“查找和替换”一“替换”对话框,此时就不能使用先复制再粘贴半角空格的方法来处理软回车了,而是应该在“查找内容”处输入“^1”(保证是英文输入状态),第一个符号是Shift+数字6,第二个是小写字母1;再点击“全部替换”按钮,Word就会提示“全部完成。完成13处替换。”,点击“确定”按钮将它关闭;接着几乎是重复这样的操作,只不过将“^l”更换为“^p”(小写字母p),硬回车也可快速被清除掉。
  
  经过以上三步攫取文本信息的操作,我们基本上就得到了还算干净的文本信息,最后只须对照原信息进行一些简单的修改和调节操作即可,大家不妨一试。

     往下看有更多相关资料

推荐文章 收藏 推荐 打印 | 整理:嘉嘉宝宝 | 阅读:
查看相关资料      
专题文章
热门评论

博聚网