青南的小世界

给时光以生命。

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
  57 Posts :: 0 Stories :: 122 Comments :: 0 Trackbacks

2019年10月31日

摘要:没有什么算法比yield关键字更简单地同时提高时间利用率和空间利用率。 阅读全文
posted @ 2019-10-31 12:31 青南 阅读 (356) 评论 (0) 编辑

2019年9月9日

摘要:我写了一个新闻类网页的通用抽取器,目前使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率,理论上可以自动抽取各种新闻网站。 阅读全文
posted @ 2019-09-09 11:36 青南 阅读 (408) 评论 (2) 编辑

2019年7月13日

摘要:详细解释,Python是如何通过优化字典的底层数据结构,实现字典有序,并且大大提高遍历效率和降低内存占用。 阅读全文
posted @ 2019-07-13 13:43 青南 阅读 (434) 评论 (0) 编辑

2019年3月31日

摘要:这篇文章深入分析了Python的round函数输出结果可能不符合预期的真正原因,同时给出了如何实现数学意义上真正的四舍五入的办法,最后吐槽了垃圾文章误导新人的问题。 阅读全文
posted @ 2019-03-31 13:13 青南 阅读 (1458) 评论 (8) 编辑

2019年2月23日

摘要:P酱是公司新来的实习生妹子。听说是一个文科生。文科生应该会去文案组或者策划组吧。什么?来数据组?让我来带? 于是我和P酱工作在了一起。 阅读全文
posted @ 2019-02-23 16:46 青南 阅读 (1286) 评论 (7) 编辑

2019年2月12日

摘要:写爬虫并不是使用Selenium + webdriver就万事大吉了。一行js代码就能识别Selenium+webdriver。本文给出了应对方案。 阅读全文
posted @ 2019-02-12 20:55 青南 阅读 (3771) 评论 (5) 编辑

2019年1月28日

摘要:在[使用Airtest超快速开发App爬虫](https://www.kingname.info/2019/01/19/use-airtest/)文章的最后,我们留了一个尾巴:如何启动Airtest的无线模式,不用USB线就能控制手机? 本文将会讲到具体的做法。做法分为两种:第一种是在Airtest的IDE中控制手机。第二种是在Python代码里面控制远程手机。 阅读全文
posted @ 2019-01-28 22:49 青南 阅读 (803) 评论 (0) 编辑

2019年1月19日

摘要:想开发网页爬虫,发现被反爬了?想对 App 抓包,发现数据被加密了?不要担心,使用 Airtest 开发 App 爬虫,只要人眼能看到,你就能抓到,最快只需要2分钟,兼容 Unity3D、Cocos2dx-*、Android 原生 App、iOS App、Windows Mobile……。 阅读全文
posted @ 2019-01-19 18:12 青南 阅读 (7446) 评论 (6) 编辑

2018年12月23日

摘要:甘特图更多的关注每一个任务的进度上。那么如果我希望了解项目整体的进度,应该如何选择呢?此时就需要引入另一个简单又强大的工具:燃尽图(Burn down chart)。 阅读全文
posted @ 2018-12-23 19:20 青南 阅读 (1678) 评论 (1) 编辑

2018年11月21日

摘要:在前面两篇文章介绍了下载器中间件的使用,这篇文章将会介绍爬虫中间件(Spider Middleware)的使用。 阅读全文
posted @ 2018-11-21 08:13 青南 阅读 (2521) 评论 (0) 编辑