2024.1.11(寒假第五天)
第五天:网络编程与爬虫基础
学习内容:
学习 Python 的 socket 库,了解如何使用 socket 创建客户端和服务器端程序,实现简单的网络通信。
学习 HTTP 协议的基本概念和请求方法,了解网页的结构和内容。
学习使用 Python 的 requests 库发送 HTTP 请求,获取网页内容,掌握请求头、请求参数、响应内容等的处理方法。
学习使用 BeautifulSoup 库解析网页内容,提取所需的数据,通过实例练习简单的网页爬取。
总结:
今天学习了 Python 中的网络编程和爬虫基础,包括使用 socket 库进行网络通信,以及使用 requests 库和 BeautifulSoup 库进行网页爬取。通过案例练习,掌握了如何发送 HTTP 请求、获取网页内容、解析网页结构等操作。在学习过程中,要注意网络编程的协议和端口,以及爬虫的合法性,避免出现网络错误或法律问题。