人生苦短,我用python之二

今天的主题爬取网页的通用代码框架

我们首先打开IDLE选择File->new window命令(或者可以直接按键Ctrl+N键,在很多地方这个按键是新建文件的意思)

我们填入代码:

 

保存文件是按键快捷键Ctrl+S,将源代码保存为hello.py的文件

按键F5运行走起(同时我们可以选择Run->Run Module命令)

IDLE中显示出现错误:

原因是name‘_name_’未定义

注意:这里需要一个长的下划线,才能使其正确,以用来区分python本身的语法

改正过后我们再次运行:

 

我们看到出现了和之前一样的结果

我们将网页连接修改一下看看会出现什么结果:

 

 结果是“产生异常”

解释一下通用代码框架:get方法请求一个链接,r.raise_for_status用来判断请求是否正常(也就是200),否则就产生异常。r.encoding = r.apparent_encoding这一句是能够是我们请求返回网页解码是正确的,最后return返回网页的内容。

此框架用来解决我们访问网页的问题。

 

 

今天的内容就是这样,每天一点点,重在坚持。加油!!!

 

    

posted @ 2018-04-25 23:40  青衫染红尘  阅读(210)  评论(0)    收藏  举报
Live2D