001 Python网络爬虫与信息提取课程前序

[A] 主要课程内容

　　1. 学习 Requests 库：自动爬取HTML页面，自动发送完网络请求

　　2. 学习 robots.txt ：网络爬虫排除标准

　　3. 学习 Becautiful Soup 库：能很好的解析HTML页面，并且提取相关信息

　　4. 实战项目A/B Projects

　　5. 学习正则表达式库 Re：正则表达式详解，提取页面关键信息

　　6. 学习网络爬虫框架 Scrapy：网络爬虫原理介绍，专业爬虫框架介绍

[B] 内容组织　

　　12个单元：8个内容单元 + 4个实例单元

[C] 常见 Python IDE工具

　　文本类工具 IDE： IDEL 和 Sublime Text

　　集成工具类 IDE： Pycharm，Anaconda $ Spyder

posted @ 2020-11-15 13:45 CarreyB 阅读(92) 评论(0) 收藏举报

刷新页面返回顶部

Carrrey