Python爬虫第一步之获取网页源代码

#coding: utf-8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

html = getHtml("http://blog.sina.com.cn/")

软件使用：Python2.7 +Pycharm，

# coding=utf-8
#coding: utf-8
#-*- coding: UTF-8 -*-
三个功能应该是一样的
PY文件当中是不支持中文的，即使你输入的注释是中文也不行，为了解决这个问题，就需要把文件编码类型改为UTF-8的类型，输入这个代码就可以让PY源文件里面有中文了。
建议你写代码之前都把这句话加上，因为不管是注释还是弹出消息提示，免不了的要输入中文，所以这个基本是必须的。（搜索自百度知道）
全文：http://blog.csdn.net/hongjinlongno1/article/details/51648687

posted @ 2016-11-26 13:54 stma 阅读(11441) 评论(0) 收藏举报

刷新页面返回顶部