随笔分类 -  爬虫

摘要:很高兴大家喜欢!Github:leonof/imgRecJs,刚刚上传,代码还需要完善~因为有不少同学表示训练和识别有疑问,我做了个小接口放在最后,可以方便大家先把流程走通。 后续会更新:将js代码等打包成chrome扩展程序,这样就可以让浏览器自动识别,完全傻瓜式使用啦~!(更新啦:利用chrom 阅读全文
posted @ 2021-07-07 15:17 苍青浪 阅读(2056) 评论(0) 推荐(0)
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- import requests from pyquery import PyQuery as pq url = 'http://www.136book.com/huaqiangu/' headers = { 阅读全文
posted @ 2019-12-10 15:11 苍青浪 阅读(881) 评论(0) 推荐(0)
摘要:实现对今日头条街拍近400条数据的爬取,感兴趣的朋友可以尝试一下 import requests from urllib.parse import urlencode import os from hashlib import md5 from multiprocessing.pool import 阅读全文
posted @ 2018-09-16 10:14 苍青浪 阅读(281) 评论(0) 推荐(0)