• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






守护式等待

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2018年12月19日

google image
摘要: google图片抓取 google图片是base64加密的,而且base64后的信息放在script信息里面 阅读全文
posted @ 2018-12-19 17:09 守护式等待 阅读(1568) 评论(0) 推荐(0)
 
CFDA
摘要: cfda数据抓取 1.网站数据是加密的,需要浏览器进行数据解析 2.网址url有js加密 3.PhantomJS无法解析数据, chrome无法获取数据,所有最终选择用Firefox浏览器 阅读全文
posted @ 2018-12-19 17:03 守护式等待 阅读(626) 评论(0) 推荐(0)
 
获取当前ip
摘要: 测ip地址http://2018.ip138.com/ic.asphttps://www.ip.cn/ 阅读全文
posted @ 2018-12-19 14:56 守护式等待 阅读(256) 评论(0) 推荐(0)
 
编码问题
摘要: 1.unicode_escape转中文 print("\u6d77\u5916".encode("unicode_escape").decode("unicode_escape")) 2.忽略部分编码错误 decode('gb2312', 'ignore') odec can't decode by 阅读全文
posted @ 2018-12-19 14:15 守护式等待 阅读(133) 评论(0) 推荐(0)
 
docker
摘要: 启动docker docker run 启动容器--name=bt5 取个名字-d 后台启动--net 选择容器的网络类型host 使用本地网络-v 挂载卷/data1/home/teng.li/dockerfiles 本地服务器目录路径/my_python 容器自动创建-w 指定工作目录/my_p 阅读全文
posted @ 2018-12-19 14:04 守护式等待 阅读(182) 评论(0) 推荐(0)
 
Scrapyd 的远程部署和监控
摘要: 1. 安装Scrapyd sudo pip3.6 install scrapyd # 安装scrapyd服务 sudo pip3.6 install scrapyd-client # 安装scrapyd客户端 1.1 修改default_scrapyd.conf文件 使外部能访问 vim /usr/ 阅读全文
posted @ 2018-12-19 13:52 守护式等待 阅读(1202) 评论(0) 推荐(0)