摘要:
列表推导式:用一行代码构建一个比较复杂有规律的列表 lst = [] for i in range(0,10,2): # 循环0-10里面所有数字 每次递增2个数字 lst.append(i) # 把 i 追加进 lst空列表 print (lst) # [0, 2, 4, 6, 8] # 生成一个 阅读全文
posted @ 2020-09-05 23:40
gemoumou
阅读(196)
评论(0)
推荐(0)
摘要:
生成器:生成器与迭代器可以看成一种,生成器的本质就是迭代器。 唯一区别,生成器是我们自己用python代码构建的数据结构,迭代器是系统提供的或者转化得来的。 获取生成器的三种方式: 生成器函数 生成器表达式 python内部提供的一些 生成器函数获得生成器 def func(): # 普通函数 pr 阅读全文
posted @ 2020-09-05 23:34
gemoumou
阅读(154)
评论(0)
推荐(0)
摘要:
增量式 概念:监测网站数据更新的情况,以便于爬取到最新更新出来的数据 实现核心:去重 实战中去重的方式:记录表 记录表需要记录的是爬取过的相关数据 爬取过的相关信息:url,标题,等唯一标识(我们使用每一部电影详情页的url作为标识) 只需要使用某一组数据,改组数据如果可以作为网站唯一标识信息即可, 阅读全文
posted @ 2020-09-05 03:32
gemoumou
阅读(611)
评论(0)
推荐(0)

浙公网安备 33010602011771号