摘要:
Python爬虫 一、爬虫相关概念介绍 1.什么是互联网爬虫 如果我们把互联网比作一张大的蜘蛛网,那一台计算机上的数据便是蜘蛛网上的一个猎物,而爬虫程序就是一只小蜘蛛,沿着蜘蛛网抓取自己想要的数据 解释1:通过一个程序,根据URL进行爬取网页,获取有用信息 解释2:使用程序模拟浏览器,去向服务器发送 阅读全文
posted @ 2024-07-10 23:25
夕瑶^
阅读(41)
评论(0)
推荐(0)
摘要:
为了用爬虫获取百度首页的源代码,检查了百度的源代码,显示编码格式为utf-8 但这样写代码,却失败了….. (这里提示:不要直接复制百度的URL,应该是http,不是https!!!) # 获取百度首页的源码 import urllib.request #(1)定义一个URL url='http:/ 阅读全文
posted @ 2024-07-10 17:36
夕瑶^
阅读(154)
评论(0)
推荐(0)

浙公网安备 33010602011771号