第十八篇:go协程练习:多协程抓取网页、ioutil简单读写、格式化字符串

引言:其他课程里我们会讲到 go的网络编程,会用到net包,它提供了底层网络操作接口。

   其中下面还有个net/http包,提供http层面的接口操作,使用它可以方便的创建http服务器。

:多协程抓取网页

今天我们先简单 用它来下载一些网页,为了中立, 我们下载博客园的文章

看这个地址

https://news.cnblogs.com/n/page/1/

这是博客园的新闻,支持页面的替换跳转到新网页

第一步:ioutil

go里的IO操作相关封装,实现了IO操作的常用函数。我们姑且用它来读取和写文件,以后再详讲

如果文件不存在则创建,存在则覆盖

 

 

循环抓取三页:

 

 使用协程抓取

 

 执行结果:

 

 页码不对,并且出现重复

 

 继续优化(解决重复问题)

 

 

 

 

执行结果:(只会出现页码不对应,但是不会出现内容重复的问题了)

 

 

 

 

 继续优化代码:

 

 

 

 

posted @ 2020-06-11 12:58  痞子胥  阅读(218)  评论(0)    收藏  举报