001 Python网络爬虫与信息提取 课程前序

[A] 主要课程内容

  1.  学习 Requests 库:自动爬取HTML页面,自动发送完网络请求

  2. 学习 robots.txt :网络爬虫排除标准

  3. 学习 Becautiful Soup 库:能很好的解析HTML页面,并且提取相关信息

  4. 实战项目A/B Projects

  5. 学习正则表达式库 Re:正则表达式详解,提取页面关键信息

  6. 学习网络爬虫框架 Scrapy:网络爬虫原理介绍,专业爬虫框架介绍

 

[B] 内容组织 

  12个单元:8个内容单元 + 4个实例单元

 

[C] 常见 Python IDE工具

  文本类工具 IDE: IDEL 和 Sublime Text

  集成工具类 IDE: Pycharm,Anaconda $ Spyder

 

posted @ 2020-11-15 13:45  CarreyB  阅读(72)  评论(0编辑  收藏  举报