Python爬虫第一步之获取网页源代码

#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")   

软件使用:Python2.7 +Pycharm,

    • # coding=utf-8
    • #coding: utf-8
    • #-*- coding: UTF-8 -*- 
      三个功能应该是一样的 
      PY文件当中是不支持中文的,即使你输入的注释是中文也不行,为了解决这个问题,就需要把文件编码类型改为UTF-8的类型,输入这个代码就可以让PY源文件里面有中文了。 
      建议你写代码之前都把这句话加上,因为不管是注释还是弹出消息提示,免不了的要输入中文,所以这个基本是必须的。(搜索自百度知道)

    • 全文:http://blog.csdn.net/hongjinlongno1/article/details/51648687
posted @ 2016-11-26 13:54  stma  阅读(11436)  评论(0)    收藏  举报