摘要: 一个很有趣的个人博客,不信你来撩 fangzengye.com import requests import re import json from bs4 import BeautifulSoup def get_one_page(url): user_agent = 'Mozilla/5.0 ( 阅读全文
posted @ 2020-05-17 15:29 开源的Boy 阅读(62) 评论(0) 推荐(0)
摘要: 一个很有趣的个人博客,不信你来撩 fangzengye.com pattern匹配 pattern = re.compile('正则表达式', re.S)‘.*?’经常用到,匹配第一次出现,没有问号则直接匹配到最后一个 items = re.findall(pattern,html_text)返回匹 阅读全文
posted @ 2020-05-17 15:10 开源的Boy 阅读(36) 评论(0) 推荐(0)
摘要: 一个很有趣的个人博客,不信你来撩 fangzengye.com 转载自Hank WechatSogou 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。 DouBanSpider 豆瓣读书爬虫。可以爬下豆瓣读书标签下的 阅读全文
posted @ 2020-05-17 08:58 开源的Boy 阅读(314) 评论(0) 推荐(0)