2022 年 3月 4 日随笔档案 - 冷月半明

2022年3月4日

摘要：小结：爬取网页很简单，只需要对爬虫头部进行伪装，然后对服务器发送请求即可。在此程序中通过构造函数getHTML来实现.而页面分析相对而言比较麻烦. 通过查看页面代码发现该页面所有问题或文章的标题都是<h4>标签. 所以我们直接查找h4标签即可，而链接是存放在<a>标签中的href属性中，然而直接搜阅读全文

posted @ 2022-03-04 22:05 冷月半明阅读(33) 评论(0) 推荐(0)

chen17

公告