正达表达式:匹配    过滤
爬取编码:
两个步骤:爬取( import    urllib.request)
                数据清洗(import   re)
import  urllib.resquest    导入爬取模块
import  re     导入正则表达式
response=urllib.request.urlopen("http://t.cn/RttEZZa")
html=response.read()
html=html.decode("utf-8”)把爬取到的数据进行解码 
ret=re.compile("百度一下")  编译   
print(ret.findall(html))     寻找所有
 
                    
                     
                    
                 
                    
                 
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号