会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zww1
博客园
首页
新随笔
联系
订阅
管理
2018年10月30日
python爬取每日新闻通过itchat发送到微信群聊
摘要: 项目不那么忙了,更新一个小脚本。实现功能:通过爬取开源咨询的网站,然后获取每日最新的咨询,每天定时自动发送的微信群里面。 一、实现思路: 通过requests爬取网站“开源资讯”的当日最新新闻,然后组装信息后,通过itchat自动发送到指定的微信群。 二、用到的主要模块: 1、爬取数据和数据解析,用
阅读全文
posted @ 2018-10-30 11:08 zww1
阅读(2167)
评论(0)
推荐(0)
2018年9月10日
python+scrapy爬虫(爬取链家的二手房信息)
摘要: 之前用过selenium和request爬取数据,但是感觉速度慢,然后看了下scrapy教程,准备用这个框架爬取试一下。 1、目的:通过爬取成都链家的二手房信息,主要包含小区名,小区周边环境,小区楼层以及价格等信息。并且把这些信息写入mysql。 2、环境:scrapy1.5.1 +python3.
阅读全文
posted @ 2018-09-10 14:33 zww1
阅读(1581)
评论(0)
推荐(0)
2018年8月20日
python爬取豆瓣书籍排行
摘要: 最近想通过爬取豆瓣数据来练习下爬虫,这次做一个爬取豆瓣书籍的信息。 需求:通过爬取豆瓣图书小说这一标签的数据,将数据存入csv或者数据库里面。 思路:先从网页上爬取数据,然后存到csv,然后读取csv的数据写到数据库中。(别问我为什么不直接写数据库,还要在csv中转一次。o(╯□╰)o。。。因为这个
阅读全文
posted @ 2018-08-20 15:24 zww1
阅读(1510)
评论(0)
推荐(0)
2018年8月17日
python+requests爬取豆瓣歌曲评论
摘要: 忙了一个月的项目,终于有时间更新了。。。。更一个用requests爬豆瓣歌曲评论的吧。 爬虫思路:通过歌曲的id和爬取的页数,爬取评论的用户名,星级,评论日期,评论内容,然后写进csv。 直接上代码吧: 爬取的过程: 爬取的结果: 这里遇到一个问题,我用excel打开的时候是乱码,用记事本打开是正常
阅读全文
posted @ 2018-08-17 14:56 zww1
阅读(882)
评论(0)
推荐(0)
2018年7月24日
安装scrapy失败的处理方式
摘要: 又是一个坑,自己埋的坑要自己来踩。。。。。 1、起因: 当前用的是python3,通过pip3安装scrapy。没注意到安装的过程中报错了。 然后直接在dos下面新建scrapy项目,是成功的,也可以成功运行。 2、导致的问题: 当我在eclipse里面建立scrapy项目,但是import scr
阅读全文
posted @ 2018-07-24 16:29 zww1
阅读(3575)
评论(0)
推荐(0)
jdk升级后,运行不了问题的解决方法
摘要: 记录一下坑爹的问题:之前系统弹出一个jdk升级的信息,然后手贱就更新了。更新后,发现jdk用不了了,eclipse打不开,cmd里面输入java也报错。 系统:win10 升级前jdk版本:1.8.0_171 升级后报错: Error: opening registry key 'Software\
阅读全文
posted @ 2018-07-24 11:46 zww1
阅读(1227)
评论(0)
推荐(0)
2018年6月20日
python+selenium爬取图片
摘要: 1、解决的问题: 之前遇到过项目中需要大量的图书图片,自己没有就只有到大型网站抓取了。 ̄□ ̄|| 2、解决的办法: 通过python+selenium到豆瓣抓取图片,可以直接把图片地址保存下来,也可以直接下载图片。 3、脚本解析:(这里没有弄成项目,直接写的一个脚本) 脚本包含2个类,一个是数据库操
阅读全文
posted @ 2018-06-20 17:11 zww1
阅读(11091)
评论(0)
推荐(0)
2018年6月8日
接口自动测试框架
摘要: 解决问题:迭代的时候,可能影响的接口很多,但是每一个都人工去回归比较浪费时间。 解决方法:写一个接口自动化测试框架,每次发正式环境前都自动跑一遍,看下是否都通过。 一、框架结构以及各种方法的说明: 二、各文件的方法: 1、emailHandler.py:发送邮件相关操作 2、ExcelHandle.
阅读全文
posted @ 2018-06-08 15:23 zww1
阅读(202)
评论(0)
推荐(0)
2018年6月6日
多线程运行Jmeter脚本
摘要: 解决问题:之前对数据库用Jmeter要做一个压力测试的时候,由于有多个Jmeter脚本且希望所有脚本都是在同一时间运行。 解决方法:所以用python写了一个多线程运行的小脚本来执行多个jmk脚本。 一、框架结构以及各种方法的说明: 二、各文件的方法: (1)TxtOperating.py,文件操作
阅读全文
posted @ 2018-06-06 10:45 zww1
阅读(309)
评论(0)
推荐(0)
2018年6月4日
unittest框架使用
摘要: 一、unittest主要属性介绍: unittest.TestCase:TestCase类,所有的测试用例类都继承的基类。 unittest.TestSuite():TestSuite()类是用来创建测试套件的。(可以一个模块归为一个测试套件,方便执行和管理) unittest.main():将一个
阅读全文
posted @ 2018-06-04 15:20 zww1
阅读(172)
评论(0)
推荐(0)
下一页
公告
点击右上角即可分享