2017 年 2月 12 日随笔档案 - 可豆豆

Python 爬虫-抓取小说《鬼吹灯之精绝古城》

摘要：想看小说《鬼吹灯之精绝古城》，可是网页版的好多广告，还要一页一页的翻，还无法复制，于是写了个小爬虫，保存到word里慢慢看。代码如下： """ 爬取《鬼吹灯之精绝古城》小说 """ from selenium import webdriver import os from docx import 阅读全文

posted @ 2017-02-12 21:49 可豆豆阅读(588) 评论(0) 推荐(0)

Python-爬虫之股转系统下载文件自动翻页

摘要：上次代码只能抓取一个网页上的链接，本次可以自主设定抓取的页面个数。代码如下： from selenium import webdriver import os, time class DownloadFiles(): def __init__(self): self.url = 'http://w 阅读全文

posted @ 2017-02-12 15:50 可豆豆阅读(735) 评论(0) 推荐(0)

Python 爬虫-抓取中小企业股份转让系统公司公告的链接并下载

摘要：系统运行系统:MAC 用到的python库：selenium、phantomjs等由于中小企业股份转让系统网页使用了javasvript，无法用传统的requests、BeautifulSoup库获取想要的下载链接，所以这次使用selenium、phantomjs库，这两个库的安装方法百度搜索就可阅读全文

posted @ 2017-02-12 12:47 可豆豆阅读(1191) 评论(0) 推荐(0)

可豆豆

Python 爬虫-抓取小说《鬼吹灯之精绝古城》

Python-爬虫之股转系统下载文件自动翻页

Python 爬虫-抓取中小企业股份转让系统公司公告的链接并下载

导航

公告