摘要: 抓取一个网页内容非常容易,常见的方式有curl、file_get_contents、socket以及文件操作函数file、fopen等。 下面使用SOCKET下的fsockopen()函数访问Web服务器最常用的80端口,通过获取80端口的数据,并进行分析,来模拟网络爬虫的工作方法。 1、实现SOC 阅读全文
posted @ 2017-12-25 17:47 才鱼 阅读(2020) 评论(0) 推荐(0) 编辑
摘要: 使用fsockopen()函数来实现获取页面信息,完整代码如下 根据以上示例,可以进行通过设置请求头信息,即可实现任意端口的访问 代码执行后效果 阅读全文
posted @ 2017-12-25 17:47 才鱼 阅读(460) 评论(0) 推荐(0) 编辑