2025 年 6月 29 日随笔档案 - takenika

2025年6月29日

摘要：使用 urllib 来获取百度首页的源码，通过首页源码获取针对的数据。定义一个 url变量 url='http://www.baidu.com' 模拟浏览器向服务器发送请求。 response=urllib.request.urlopen(url) 获取响应中的页面的源码 content = re 阅读全文

posted @ 2025-06-29 23:44 takenika 阅读(81) 评论(0) 推荐(0)

爬虫介绍

摘要：爬虫：获取互联网信息的程序，由于程序行为像蜘蛛所以将这类程序称为爬虫。解释1：通过一个程序根据url爬取网页，获取有用的额信息。解释2：使用程序模拟浏览器，去向服务器发送请求，获取相应信息。爬虫网页：爬取整个网页，包含了网页中所有的内容。解析数据：将网页中得到的数据进行解析，获取针对性需要的阅读全文

posted @ 2025-06-29 23:15 takenika 阅读(58) 评论(0) 推荐(0)

序列化和反序列化

摘要：序列化：把内存中的数据转换为字符序列。对象 -> 字节序列凡序列化：将字符序列恢复到内存中。通过文件操作，可以将字符写入到一个本地文件，但是，如果是一个对象（例如列表、字典、元组等），就无法直接写入到一个文件中，需要先对这个数据转换为字符序列才能写入到文件中。序列化 dumps() 序列化阅读全文

posted @ 2025-06-29 16:34 takenika 阅读(22) 评论(0) 推荐(0)

理解代码

摘要：我如何去理解代码我没有适应写代码的方式，觉得语句没有像没有像语文中文件那样阐述清楚。现在想来就读代码就像是一种翻译，将代码翻译成人读懂的话，代码相比如直接阐述当然不直接，但是也符合预先设定的逻辑表达。比如 animals=['pig','cat','dog','cow'] for animal 阅读全文

posted @ 2025-06-29 01:59 takenika 阅读(7) 评论(0) 推荐(0)

文件相关

摘要：文件的打开与关闭打开文件/创建文件在python中使用 open 函数，可以打开一个已经存在的文件，或者创建一个新文件。 open(文件路径,访问模式) 使用上述方式带上不存在的路径是不会创建文件夹的。 file = open('./newFile.txt','w') 变量是打开文件对象的引用名阅读全文

posted @ 2025-06-29 01:52 takenika 阅读(2) 评论(0) 推荐(0)