第3次作业-MOOC学习笔记:Python网络爬虫与信息提取

1.注册中国大学MOOC

 

  2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程

 

 

 

 3.学习完成第0周至第4周的课程内容,并完成各周作业

 

 

 4.提供图片或网站显示的学习进度,证明学习的过程。

5.写一篇不少于1000字的学习笔记,谈一下学习的体会和收获。

 

 

   在中国大学MOOC中我大概花费了半个月的时间学习了Python网络爬虫与信息提取。通过这次的学习让我对Python的基础知识有了更加全面的认知,同时也知道什么是网络爬虫。

   在第一周中,第一单元是Requests库入门,它让我知道了Requests库有七种主要方法和它的get方法;然后又了解了Response对象的属性和编码,爬去网页的通用代码框架。第二单元则是何为网络爬虫,其中有关于网络爬虫的限制和 Robots协议。第三单元则向我展示了Requests库网络爬取实战的相关案例。

  在第二周中,第四单元向我介绍了Beautiful Soup库入门的知识,其中有着如何安装引用Beautiful Soup库,也详细介绍了Beautiful Soup库的相关知识。第五单元则是信息标记和提取方法,介绍了信息标记的三种形式和信息提取的一般方法。第六单元,是中国大学定向爬虫的实例编写和结构分析。

  在第三周中,第七单元Re库入门,向我介绍了正则表达式的概念、语法和使用。让我了解了正则表达式的常用操作符。第八单元,则是另一则实例,淘宝商品比价定向爬虫,介绍了其功能和其具体的代码。第九单元,也是一则实例,股票数据定向爬虫。

   在第四周中,第十单元是Scrapy爬虫框架,具体介绍了Scrapy爬虫框架的结构。同时将Scrapy爬虫框架和Requests做了比较。第十一单元中,Scrapy爬虫的基本使用。第十二单元中,是关于Scrapy爬虫在股票中的具体使用。

   通过这次学习让我受益匪浅,同时也让我认识到了自身的不足,所以我将会更加认真的学习,努力跟上老师上课速度。

posted @ 2019-10-30 22:13  cardjoker  阅读(115)  评论(0)    收藏  举报