摘要: docker参考博客 https://www.cnblogs.com/eden-libinglin/p/13803729.html https://www.lixian.fun/3812.html https://www.warlock.live/archives.html nginx参考博客 ht 阅读全文
posted @ 2020-11-23 23:53 食蚁兽 阅读(111) 评论(0) 推荐(0)
摘要: everything-is-local Author:Shine Version:9.0.2 一、引言 在单人开发过程中,需要进行版本管理,以利于开发进度的控制。 在多人开发过程中,不仅需要版本管理,还需要进行多人协同控制。 二、介绍 Git是一个开源的分布式版本控制系统,用于敏捷高效地处理任何或小 阅读全文
posted @ 2020-11-23 18:07 食蚁兽 阅读(61) 评论(0) 推荐(0)
摘要: 本项目中介绍 使用了selenium,需要添加匹配的chromedriver.exe的路径在webdriver.Chrome(executable_path='path') 请求视频详情页 如:https://www.pearvideo.com/video_1708124 , xpath 解析、获取 阅读全文
posted @ 2020-11-23 12:47 食蚁兽 阅读(652) 评论(0) 推荐(0)
摘要: 本项目简单介绍 爬取网易中的五大板块新闻:国内、国际、军事、航空、无人机 初始url是:https://news.163.com/,板块url类似:https://news.163.com/domestic/ 从初始url获取各个板块url地址,然后获得板块中系列新闻的标题 title 和详情 ur 阅读全文
posted @ 2020-11-23 12:27 食蚁兽 阅读(114) 评论(0) 推荐(0)
摘要: 本项目中运用了相关技术 fake_useragent的随机ua http://www.goubanjia.com/中的动态代理ip time.sleep(delay)随机延迟数,来降低被反爬虫策略监控的风险 存储数据在mysql数据库中 经本人测试,可爬取阳光政务的 http://wz.sun076 阅读全文
posted @ 2020-11-23 11:57 食蚁兽 阅读(189) 评论(0) 推荐(0)