摘要: 创建应用 下载sdk 接入文档链接:https://ai.baidu.com/ai-doc/OCR/3k3h7yeqa#%E9%80%9A%E7%94%A8%E6%96%87%E5%AD%97%E8%AF%86%E5%88%AB 解压 新建AipOcr: AipOcr是OCR的Python SDK客 阅读全文
posted @ 2020-08-24 22:23 gemoumou 阅读(493) 评论(0) 推荐(0)
摘要: 网址:http://ai.baidu.com/ 百度AI实现的爬虫功能: 图像识别 语音识别/语音合成 自然语言处理 使用流程 点击控制台登录 选择想要的功能 在功能下创建一个app 选择对应的pythonSDK文档进行代码实现 语音合成案例: 首先在百度ai上创建一个应用 选择pythonSDK进 阅读全文
posted @ 2020-08-24 20:29 gemoumou 阅读(715) 评论(0) 推荐(0)
摘要: 验证码识别 基于线上的打码平台识别验证码 打码平台有: 1,超级鹰(推荐)http://www.chaojiying.com/ 2,云打码 打码兔等 超级鹰的使用: 1,注册登录购买账户积分 2,创建一个软件ID 创建好后就会生成一个id信息 3,选择超级鹰开发文档 选择对应的语言 点击下载 封装好 阅读全文
posted @ 2020-08-24 14:11 gemoumou 阅读(284) 评论(0) 推荐(0)
摘要: 爬虫代理概述 在爬虫中,所谓的代理指的就是代理服务器 代理服务器的作用就是用来转发请求和响应 如果我们的爬虫在短时间内对服务器发起高频的请求,那么服务器会检测到这样的一个异常行为请求,就会将该请求对应设备的ip进行封禁,设备就无法对服务器再次进行请求发送了 使用代理服务器进行信息爬取,可以很好的解决 阅读全文
posted @ 2020-08-24 10:56 gemoumou 阅读(141) 评论(0) 推荐(0)