摘要: 新华网爬虫(2022年6月) 1 分析网站结构 新华网网址:新华网_让新闻离你更近 (news.cn) 新华网的首页是带有关键词搜索功能的,我们尝试在搜索栏随意搜索一个关键词 可以发现新华网一次最多可以爬取的数据是10000条,且其数据是通过分页显示的 2 分析网页具体组成 在搜索后的显示页面按下F 阅读全文
posted @ 2022-07-17 15:00 jacknie23 阅读(2833) 评论(7) 推荐(0) 编辑
摘要: 方法的参数不同 append 方法是向原list的末尾添加一个对象(任意对象;如元组,字典,列表等),且只占据一个原list的索引位,添加后无返回值,直接在原列表中添加。 list.append(object) list1 = ["hello", "world"] list2 = "hello" l 阅读全文
posted @ 2022-07-17 14:55 jacknie23 阅读(305) 评论(0) 推荐(1) 编辑