摘要:
使用 urllib 来获取百度首页的源码,通过首页源码获取针对的数据。 定义一个 url变量 url='http://www.baidu.com' 模拟浏览器向服务器发送请求。 response=urllib.request.urlopen(url) 获取响应中的页面的源码 content = re 阅读全文
posted @ 2025-06-29 23:44
takenika
阅读(81)
评论(0)
推荐(0)
摘要:
爬虫:获取互联网信息的程序,由于程序行为像蜘蛛所以将这类程序称为爬虫。 解释1:通过一个程序根据url爬取网页,获取有用的额信息。 解释2:使用程序模拟浏览器,去向服务器发送请求,获取相应信息。 爬虫网页:爬取整个网页,包含了网页中所有的内容。 解析数据:将网页中得到的数据进行解析,获取针对性需要的 阅读全文
posted @ 2025-06-29 23:15
takenika
阅读(58)
评论(0)
推荐(0)
摘要:
序列化: 把内存中的数据转换为字符序列。对象 -> 字节序列 凡序列化:将字符序列恢复到内存中。 通过文件操作,可以将字符写入到一个本地文件,但是,如果是一个对象(例如列表、字典、元组等),就无法直接写入到一个文件中,需要先对这个数据转换为字符序列才能写入到文件中。 序列化 dumps() 序列化 阅读全文
posted @ 2025-06-29 16:34
takenika
阅读(22)
评论(0)
推荐(0)
摘要:
我如何去理解代码 我没有适应写代码的方式,觉得语句没有像没有像语文中文件那样阐述清楚。 现在想来就读代码就像是一种翻译,将代码翻译成人读懂的话,代码相比如直接阐述当然不直接,但是也符合预先设定的逻辑表达。 比如 animals=['pig','cat','dog','cow'] for animal 阅读全文
posted @ 2025-06-29 01:59
takenika
阅读(7)
评论(0)
推荐(0)
摘要:
文件的打开与关闭 打开文件/创建文件 在python中使用 open 函数,可以打开一个已经存在的文件,或者创建一个新文件。 open(文件路径,访问模式) 使用上述方式带上不存在的路径是不会创建文件夹的。 file = open('./newFile.txt','w') 变量是打开文件对象的引用名 阅读全文
posted @ 2025-06-29 01:52
takenika
阅读(2)
评论(0)
推荐(0)

浙公网安备 33010602011771号