11 2019 档案
摘要:什么是爬虫? 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网
阅读全文
摘要:一、打开文件、关闭文件操作 想要读取文件或是写入文件,第一步便是打开文件,最后一步便是关闭文件。这里介绍两种打开(关闭)文件的方式: 1、open()方法 f=open(file_name[,access_mode][,buffering]) f=close() 其中,file_name代表文件名,
阅读全文
摘要:错误和异常 Python 中(至少)有两种错误:语法错误和异常( syntax errors 和 exceptions )。 1.1、语法错误 语法错误,也被称作解析错误: while True print('Hello world') File "<stdin>", line 1, in ? wh
阅读全文
摘要:字典 字典是Python提供的一种常用的数据结构,它用于存放具有映射关系的数据。 比如有份成绩表数据,语文:79,数学:80,英语:92,这组数据看上去像两个列表,但这两个列表的元素之间有一定的关联关系。如果单纯使用两个列表来保存这组数据,则无法记录两组数据之间的关联关系。 为了保存具有映射关系的数
阅读全文