07 2017 档案

摘要:Time.sleep(秒数):可以让程序休眠多少秒,爬虫时设置休眠的时间间隔,可以减少服务器的压力,避免被反爬虫。 阅读全文
posted @ 2017-07-06 17:56 mango_lee 阅读(100) 评论(0) 推荐(0)
摘要:当遇到解析出来的代码和html中显示的不同时,注意headers参数的设置 阅读全文
posted @ 2017-07-05 21:32 mango_lee 阅读(224) 评论(0) 推荐(0)
摘要:创建list 方式一: new_list=[function(item) for item in set],其中set表示可循环对象,function(item)表示item的函数 阅读全文
posted @ 2017-07-05 15:39 mango_lee 阅读(182) 评论(0) 推荐(0)
摘要:与 (1) 在客户端,Get方式在通过URL提交数据,数据在URL中可以看到;POST方式,数据放置在HTML HEADER内提交。 (2) GET方式提交的数据最多只能有1024 Byte,而POST则没有此限制。 (3) 安全性问题。正如在(1)中提到,使用 Get 的时候,参数会显示在地址栏上 阅读全文
posted @ 2017-07-04 14:12 mango_lee 阅读(12198) 评论(0) 推荐(1)
摘要:https://home.cnblogs.com/blog/ 阅读全文
posted @ 2017-07-03 11:19 mango_lee 阅读(264) 评论(0) 推荐(0)