2017年2月12日

Python 爬虫-抓取小说《鬼吹灯之精绝古城》

摘要: 想看小说《鬼吹灯之精绝古城》,可是网页版的好多广告,还要一页一页的翻,还无法复制,于是写了个小爬虫,保存到word里慢慢看。 代码如下: """ 爬取《鬼吹灯之精绝古城》小说 """ from selenium import webdriver import os from docx import 阅读全文

posted @ 2017-02-12 21:49 可豆豆 阅读(584) 评论(0) 推荐(0)

Python-爬虫之股转系统下载文件自动翻页

摘要: 上次代码只能抓取一个网页上的链接,本次可以自主设定抓取的页面个数。 代码如下: from selenium import webdriver import os, time class DownloadFiles(): def __init__(self): self.url = 'http://w 阅读全文

posted @ 2017-02-12 15:50 可豆豆 阅读(733) 评论(0) 推荐(0)

Python 爬虫-抓取中小企业股份转让系统公司公告的链接并下载

摘要: 系统运行系统:MAC 用到的python库:selenium、phantomjs等 由于中小企业股份转让系统网页使用了javasvript,无法用传统的requests、BeautifulSoup库获取想要的下载链接,所以这次使用selenium、phantomjs库,这两个库的安装方法百度搜索就可 阅读全文

posted @ 2017-02-12 12:47 可豆豆 阅读(1189) 评论(0) 推荐(0)

导航