2019 年 5月随笔档案 - 小陆同学

将scrapy爬取数据通过django入到SQLite数据库

摘要：1. 在django项目根目录位置创建scrapy项目，django_12是django项目，ABCkg是scrapy爬虫项目，app1是django的子应用 2.在Scrapy的settings.py中加入以下代码 3.编写爬虫，下面代码以ABCkg为例，abckg.py 4.scrapy中ite 阅读全文

posted @ 2019-05-21 19:11 小陆同学阅读(1317) 评论(0) 推荐(0)

django--中运行scrapy框架

摘要：1.新建一个django项目， 2.前端展示一个按钮 3.在django项目的根目录创建scrapy项目 4.cmd命令行运行：scrapyd 启动服务 5.将scrapy项目部署到当前工程：scrapyd-deploy 爬虫名称 -p 项目名称 6.views.py 7.在本地6800端口点击jo 阅读全文

posted @ 2019-05-20 17:22 小陆同学阅读(3393) 评论(1) 推荐(1)

spider-通过scrapyd网页管理工具执行scrapy框架

摘要：1.首先写一个scrapy框架爬虫的项目 2.部署环境 3.在爬虫项目目录下输入命令：scrapyd，已经在本地6800端口运行 4.在爬虫根目录执行：scrapyd-deploy,如果提示不是内部命令，需要到python目录下scripts下新建一个名为scrapyd-deploy.bat的文件，阅读全文

posted @ 2019-05-20 11:31 小陆同学阅读(1492) 评论(0) 推荐(1)

python--numpy生成正态分布数据及randint randn normal的使用

摘要：正太分布：也叫（高斯分布Gaussian distribution），是一种随机概率分布机器学习中numpy.random如何生成这样的正态分布数据，本篇博客记录这样的用法 import numpy as np# a = np.random.randint(1,10,size=2) # 最小值,最阅读全文

posted @ 2019-05-07 19:17 小陆同学阅读(14381) 评论(1) 推荐(2)

python-pandas读取mongodb、读取csv文件

摘要：续上一篇博客（‘’selenium爬取NBA并将数据存储到MongoDB‘）https://www.cnblogs.com/lutt/p/10810581.html 本篇的内容是将存储到mongo的数据用pandas读取出来，存到CSV文件，然后pandas读取CSV文件。其中mongo的操作涉及阅读全文

posted @ 2019-05-05 00:28 小陆同学阅读(2147) 评论(0) 推荐(0)

selenium爬取NBA并将数据存储到MongoDB

摘要：selenium：浏览器自动化测试框架，Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。 mongodb：是一个基于分布式文件存储的数据库。由C++语言编写。介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。业务需求：将某网站的数据用py 阅读全文

posted @ 2019-05-05 00:16 小陆同学阅读(800) 评论(0) 推荐(0)

机器学习--matplotlib绘制各种图表

摘要：机器学习三剑客：numpy、pandas、matplotlib NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵。 pandas 是基于numpy的一种工具，该工具是为了解决数据分析任务而创建的。 Matplotlib 是一个 Python 的 2D绘图库，它以阅读全文

posted @ 2019-05-03 23:15 小陆同学阅读(3516) 评论(0) 推荐(0)

小陆同学

导航