摘要: 接触过爬虫的人都知道,有很多html是js渲染后才有数据给予解析的,php执行JavaScript可以有V8 javascript engine,要想获取渲染后的html也可以直接使用 php的扩展 querylist 采集,文档: 不过这里想聊聊phantomjs的api接口文档,以前只会命令行模 阅读全文
posted @ 2019-02-11 10:45 许伟强 阅读(982) 评论(0) 推荐(0)
摘要: 服务器环境主要为lnmp,最近想理解一些fpm的一些常见配置,就将 fpm.d.www.conf 和 php-fpm.conf 的配置解释看了一遍,常用功能如下: 1、fpm的慢日志监控,可以快速定位一些504之类请求原因 2、fpm的进程数管理,可以有效防止宕机 详解推荐: 3、用户权限管理,给予 阅读全文
posted @ 2019-02-11 10:28 许伟强 阅读(190) 评论(0) 推荐(0)
摘要: 最近有一个小任务是生成海报 - 以供用户分享引流,无奈对GD库并不熟悉,只得网上找轮子,其中涉及到的问题有: 1、二维码添加到海报背景图之中 PHP操作图片使用GD库,添加文字以及图片: 2、将微信头像转为圆形 3、往微信公众平台生成的二维码中间加入公众号logo 4、远程下载图片到本地 5、PHP 阅读全文
posted @ 2018-11-14 10:15 许伟强 阅读(3518) 评论(0) 推荐(0)
摘要: 最近需要检测一下书籍封面的LOGO问题,文字识别,只能试试百度的api接口了,然后通用接口好办、直接传url值为图片的http地址就行,但是你说,高精度的那个,按照文档:所有图片均需要base64编码、去掉编码头后再进行urlencode。我试了几次,网上的工具也好,自己写demo处理也好就是返回i 阅读全文
posted @ 2018-10-25 10:24 许伟强 阅读(1294) 评论(0) 推荐(0)
摘要: 写爬虫的时候,使用guzzle异步并发的get请求真的好用,可以快速爬取,及时PHP不是多线程的,却能使用协程实现异步并发-用户态的多线程,也有时候,请求地址返回的页面很多待执行的JavaScript代码,数据需要动态渲染上去,这里有个简单的方法 就是使用querylist,用了这个扩展也可以不再依 阅读全文
posted @ 2018-10-22 11:22 许伟强 阅读(10195) 评论(0) 推荐(0)
摘要: 在建表的时候,总有一些模糊的点让我不得不百度: 1、金钱字段存储应当选择float、decimal、double? 应当选择decimal。 他是以字符串形式存储的,不会损失精度,为啥浮点型的(单精度、双精度)会损失精度呢,看下面的例子:定点数如果不写精度和标度,则按照默认值decimal(10,0 阅读全文
posted @ 2018-10-18 10:44 许伟强 阅读(256) 评论(0) 推荐(0)
摘要: 加密的类型: 在日常设计及开发中,为确保数据传输和数据存储的安全,可通过特定的算法,将数据明文加密成复杂的密文。目前主流加密手段大致可分为单向加密和双向加密。 单向加密:通过对数据进行摘要计算生成密文,密文不可逆推还原。算法代表:Base64,MD5,SHA; 双向加密:与单向加密相反,可以把密文逆 阅读全文
posted @ 2018-10-13 22:43 许伟强 阅读(24270) 评论(0) 推荐(0)
摘要: 搭建的环境是LNMP: 1、安装MySQL 这个非常简单我用的是Ubuntu那么就用apt源,下载deb文件然后按照全新安装文档按顺序:a.加入apt库 b.更新apt库 c.安装 d.运行MySQL 下载: 文档: 2、PHP 这里开启php-fpm,监听9000端口。 相关文档: a. 下载 任 阅读全文
posted @ 2018-04-22 21:07 许伟强 阅读(1732) 评论(0) 推荐(0)
摘要: XSS(Cross Site Script,跨站脚本攻击) XSS(Cross Site Script,跨站脚本攻击)是向网页中注入恶意脚本在用户浏览网页时在用户浏览器中执行恶意脚本的攻击方式。 攻击形式有两种: 反射型攻击(就是到处发小黄网链接用户点击了以后通过脚本窃取你的数据,所以年轻人悠着点) 阅读全文
posted @ 2018-03-09 13:58 许伟强 阅读(451) 评论(0) 推荐(0)
摘要: 一直对于字符编码不是很清晰,今天各种百度百科刷一下,最后看到一篇文章: 写的实在太好了,以上总结就是 ASCII => GB2312 => GBK => Unicode。 unicode跟utf-8、utf -16、utf-32有什么关系呢? 为什么所有网站更钟情于utf-8呢? GB2312、GB 阅读全文
posted @ 2018-02-16 00:42 许伟强 阅读(213) 评论(0) 推荐(0)