第十八篇:go协程练习:多协程抓取网页、ioutil简单读写、格式化字符串
引言:其他课程里我们会讲到 go的网络编程,会用到net包,它提供了底层网络操作接口。
其中下面还有个net/http包,提供http层面的接口操作,使用它可以方便的创建http服务器。
一:多协程抓取网页
今天我们先简单 用它来下载一些网页,为了中立, 我们下载博客园的文章
看这个地址
https://news.cnblogs.com/n/page/1/
这是博客园的新闻,支持页面的替换跳转到新网页
第一步:ioutil包
go里的IO操作相关封装,实现了IO操作的常用函数。我们姑且用它来读取和写文件,以后再详讲
如果文件不存在则创建,存在则覆盖

循环抓取三页:

使用协程抓取

执行结果:


页码不对,并且出现重复
继续优化(解决重复问题)

执行结果:(只会出现页码不对应,但是不会出现内容重复的问题了)



继续优化代码:


浙公网安备 33010602011771号