06 2021 档案
摘要:python画统计图(二) fig = plt.gca() # 获取当前的Figure对象,如果没有就新建一个Figure # 保存统计图 fig.savefig('figure.pdf', dpi=fig.dpi, format='pdf', pad_inches=0,bbox_inches='t
阅读全文
摘要:基于非时序观察数据的因果关系发现 蔡瑞初,陈薇,张坤,郝志峰, 基于非时序观察数据的因果关系发现综述,2017, Vol.40,在线出版号 No.6 CAI Rui-Chu, CHEN Wei, ZHANG Kun, HAO Zhi-Feng, A Survey on Non-Temporal Se
阅读全文
摘要:代码特殊注释 TODO:相当于备忘录,表示这个地方需要实现的一些功能或者检查等,由于其他的原因没有及时完成工作,可以做个标记 FIXME:表示这里有bug需要去修复 在pycharm提供了这部分的功能,能够汇聚所有代码中出现的特殊注释,方便程序员能快速定位。 步骤如下: 显示窗口 点开窗口
阅读全文
摘要:Gating filter Gating Filter: The Gate controls the path through which information flows in the network and have proven to be useful for recurrent neur
阅读全文
摘要:python异步(Async)编程 异步和同步的概念 同步:一个一个步骤的往下执行。只有在上一步完成后,程序才会进入下一个步骤。例子:批处理程序、命令行程序 异步:不用于同步的是,系统不会等待执行步骤完成后再继续执行下一个步骤。 异步的优势 同步网络服务器,在需要处理大量的访问请求的时候,服务器有多
阅读全文
摘要:集成学习 目录集成学习思维图方法种类集成方法原理误差和方差原理可选取的基分类器集成学习例子Boosting算法代表GBDT:梯度提升决策树Adaboost:基于错误率的提升方法Bagging算法代表随机森林缺点XGBoost库参考 思维图 什么是集成学习?集成学习:通过某种策略来组合多个弱学习器来学
阅读全文
摘要:爬虫方案设计(三) 仅供个人交流学习使用,禁止转载,严禁商用!!!任何商业用途与本人无关! 本篇的任务是爬取上篇获得的视频底下的评论。 爬取目标: 主要是针对不同的错误进行处理,把不能处理的错误存储在日志中,尽量保证程序发生错误保证不会意外停止,同时爬取速度不会过快,还不会发生遗漏。 一般出现的错误
阅读全文
摘要:爬虫方案设计(二) 仅供个人交流学习使用,禁止转载,严禁商用!!!任何商业用途与本人无关! 根据上一篇博客的分析,围绕着三要素来设计程序。 本篇的任务是爬取创作者上传的视频信息。 爬取策略: 第一种:遍历创作者id的合理范围(目前只实现了); 第二种:广度遍历有人气的创作者或者每个视频主题的代表创作
阅读全文
摘要:爬虫方案设计(一) 算不上爬虫教程。仅供个人交流学习使用,禁止转载,严禁商用!!!任何商业用途与本人无关! 任务: 爬取某视频网站的内容 目标: 遍历视频作品 遍历视频作品的所有评论 构建用户观看历史记录(通过评论去分析曝光,因为弹幕数据没有用户id信息,因此不作为分析目标) 数据简单分析及其可视化
阅读全文
摘要:> 今天你的车加油了吗? 在评论区说说你的烦心事和开心事。 **一首歌送给各位小兄弟!**
阅读全文
摘要:本教程浅入深出,有详细的参考资料来提高,有简单的入门资料能你快速掌握并使用。 欢迎联系转载,以及补充。 官网介绍:MongoDB是为现代应用程序开发人员和云时代构建的通用、基于文档的分布式数据库。 选取这个数据库的理由: python接口使用方便(丰富的 JSON 文档,支持嵌套对象,最自然、最高效
阅读全文

浙公网安备 33010602011771号