js删除html标记 去掉所有html标记 百度文库内容copy

 

js删除html标记 去掉所有html标记

function delHtml(str){
    return str.replace(/<[^>]+>/g,"");  //正则去掉所有的html标记
}
//调用测试
delHtml("<div>aaa</div>")
返回结果:aaa

加上去script与style里的内容

function delHtml(str){
    str = str.replace("<script[^>]*>[\\d\\D]*?</script>","");//去script
    str = str.replace("<style[^>]*>[\\d\\D]*?</style>",""); //去style
    return str.replace(/<[^>]+>/g,""); //正则去掉所有的html标记 
}

 

document.getElementById("dd").innerHTML.replace(/<\/?.+?>/g, "")

 

得到百度文库某一页所有文字,先要滚动条移动到该页:

然后按F12,在Console下用以下代码:

document.getElementById("pageNo-8").innerHTML.replace(/<\/?.+?>/g, "")

//上面代码将得到第8页内容

posted @ 2019-12-20 16:16  为乐而来  阅读(791)  评论(0编辑  收藏  举报