博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

随笔分类 -  python

摘要:from bs4 import BeautifulSoup import re from urllib import request req = request.urlopen("https://en.m.wikipedia.org/wiki/Main_Page").read().decode("utf-8"); soup = BeautifulSoup(req,"html.parser");... 阅读全文

posted @ 2017-12-11 22:11 sunshine_blog 阅读(1681) 评论(0) 推荐(0)

摘要:1,beautifulsoup的中文文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ 2, 1)soup.prettify()的作用是把html格式化输出 2)在输出是会发出警告:No parser was explicitly 阅读全文

posted @ 2017-12-10 17:39 sunshine_blog 阅读(315) 评论(0) 推荐(0)

摘要:一,抓百度网页对象,输出网页内容 1,其中from urllib import request,这个再cmd中检查是否安装,直接输入from urllib import request,如果没安装则输入:pip install urllib 2,req.read().decode("utf-8"), 阅读全文

posted @ 2017-12-09 22:25 sunshine_blog 阅读(221) 评论(0) 推荐(0)