第3次作业-MOOC学习笔记：Python网络爬虫与信息提取

1.注册中国大学MOOC

2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程

3.学习完成第0周至第4周的课程内容，并完成各周作业

4.提供图片或网站显示的学习进度，证明学习的过程。

5.写一篇不少于1000字的学习笔记，谈一下学习的体会和收获。

在中国大学MOOC中我大概花费了半个月的时间学习了Python网络爬虫与信息提取。通过这次的学习让我对Python的基础知识有了更加全面的认知，同时也知道什么是网络爬虫。

在第一周中，第一单元是Requests库入门，它让我知道了Requests库有七种主要方法和它的get方法；然后又了解了Response对象的属性和编码，爬去网页的通用代码框架。第二单元则是何为网络爬虫，其中有关于网络爬虫的限制和 Robots协议。第三单元则向我展示了Requests库网络爬取实战的相关案例。

在第二周中，第四单元向我介绍了Beautiful Soup库入门的知识，其中有着如何安装引用Beautiful Soup库，也详细介绍了Beautiful Soup库的相关知识。第五单元则是信息标记和提取方法，介绍了信息标记的三种形式和信息提取的一般方法。第六单元，是中国大学定向爬虫的实例编写和结构分析。

在第三周中，第七单元Re库入门，向我介绍了正则表达式的概念、语法和使用。让我了解了正则表达式的常用操作符。第八单元，则是另一则实例，淘宝商品比价定向爬虫，介绍了其功能和其具体的代码。第九单元，也是一则实例，股票数据定向爬虫。

在第四周中，第十单元是Scrapy爬虫框架，具体介绍了Scrapy爬虫框架的结构。同时将Scrapy爬虫框架和Requests做了比较。第十一单元中，Scrapy爬虫的基本使用。第十二单元中，是关于Scrapy爬虫在股票中的具体使用。

通过这次学习让我受益匪浅，同时也让我认识到了自身的不足，所以我将会更加认真的学习，努力跟上老师上课速度。

posted @ 2019-10-30 22:13 cardjoker 阅读(115) 评论(0) 收藏举报

刷新页面返回顶部

cardjoker

第3次作业-MOOC学习笔记：Python网络爬虫与信息提取

公告