摘要: 首先豆瓣电影排行榜的榜单是ajax异步加载的,不会一下子全部加载完,随鼠标下拉逐步加载数据,f12观察network请求和网站源码可轻易发现 榜单list的url地址,其response是json格式返回值 https://movie.douban.com/j/chart/top_list?type 阅读全文
posted @ 2020-01-08 22:45 allmenmustdie123 阅读(607) 评论(0) 推荐(0)
摘要: re简单实践 分析网页,很容易得出规律: css字体颜色标记电话号码 代码实现: import re import requests headers = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:71.0) Gecko/ 阅读全文
posted @ 2020-01-08 22:03 allmenmustdie123 阅读(2280) 评论(0) 推荐(0)
摘要: Python re 模块,提供了 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。 (1)re.match 函数 match函数 从字符串起始位置匹配一个模式。 语法: re.match(pattern, string, flags=0) parttern 阅读全文
posted @ 2020-01-08 20:59 allmenmustdie123 阅读(335) 评论(0) 推荐(0)