傻傻de

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

11 2018 档案

摘要:程序爬取目标 获取博客园精华区文章的 标题、标题链接、作者、作者博客主页链接、摘要、发布时间、评论数、阅读数和推荐数, 并存储到 MongoDB 中。 程序环境 已安装scrapy 已安装MongoDB 创建工程 在命令提示符中执行上述命令后,会建立一个名为 的文件夹。 创建爬虫文件 执行上述命令后 阅读全文
posted @ 2018-11-30 21:44 傻傻de 阅读(775) 评论(0) 推荐(0)

摘要:上一篇主要介绍了MongoDB的基本操作,包括创建、插入、保存、更新和查询等,链接为 "MongoDB基本操作" 。 在本文中主要介绍MongoDB的聚合以及与Python的交互。 MongoDB聚合 什么是聚合 MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等), 阅读全文
posted @ 2018-11-29 17:49 傻傻de 阅读(488) 评论(0) 推荐(0)

摘要:什么是MongoDB 以下摘自百度百科: MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类 阅读全文
posted @ 2018-11-26 15:56 傻傻de 阅读(2670) 评论(0) 推荐(2)

摘要:最近开通了博客,看到网上好多推荐markdown的,而且博客园支持markdown,所以决定学习一下。 百度百科对markdown的介绍: Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。 Markdown的语法简洁明了、学习容易, 阅读全文
posted @ 2018-11-24 10:54 傻傻de 阅读(444) 评论(0) 推荐(0)