[转]tppabs是什么?如何去除tppabs?

原文地址:http://www.cnblogs.com/gdsblog/archive/2017/03/25/6616561.html

不得不说,一款伟大的软件,就是用来解放人类双手的,Teleport Pro这款软件,是一款扒站软件,就是可以把别人的网站扒到你的本地,然后,细心的朋友会发现,呵!怎么多了一个莫名其妙的东西!也就是tppabs标签,怎么回事呢?请看下文介绍:

 

 

使用Teleport Pro软件的朋友应该知道他是一个离线浏览器,而他更大的作用则是可以用来下载别人的整站,软件的功能虽然好,但是却有一个很头疼的缺点,那就是下载下来 的网页它会在图片标签内插入tppabs标签以记录该图片的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。如图所示:

 


 


关键词:取出tppabs标记,去除tppabs标记,批量去除tppabs标记

 

 

如果手动清除的话,那将是一个不可想象的任务。其实可以在 DreamWeaver中使用正则表达式批量清除tppabs标签.

  具体写法如下:

  匹配tppabs标签:

  \btppabs="h[^"]*"

  替换为
  (空)

  匹配javascript代码:
  href="javascript:if\(confirm\('htt[^"]*"
  替换为
  href="../"
  注意替换的时候.应该勾选 "使用正则表达式"

       如图所示:

 

EditPlus替换方法:

 


  1.使用ep批量删除teleport下载页面中的多于标签


  在使用teleport下载页面后,链接后面基本上都会添加tppabs="..."的标记,有些站外链接,还会加上javascript:if(confirm(...))window.location=...的语句,使用下面的方法,可以迅速清除这类标签:


  用ep打开所有需要修改的文件,按下ctrl+h,勾选'正则表达式',查找内容输入


   tppabs="[^"]+"


  (注意最前面有空格),替换内容为空,范围选择所有打开的文件,全部替换


  查找内容输入


  javascript\:ifconfirm\([)]+\)window\.location='([^']+)'


  替换内容输入\1,全部替换,ok,上面的信息都被清除

 

总结一下,在notepad++或者editplus中的替换规则:

 [空格]tppabs="[^"]+" ==》  [空格]

/\*tpa=[^*]+\*/  ==》  [空格]

javascript\:ifconfirm\([)]+\)window\.location='([^']+)' ==》\1

posted @ 2017-08-17 08:38  dirgo  阅读(4033)  评论(0编辑  收藏  举报