随笔分类 -  Python

python 基础语法、python 面向对象、第三方库等
摘要:现有一份介绍某地点的 txt 文件,需要编写 Python 程序制作介绍文档的词云图。 #读取数据 ##数据预处理 文本中可能存在着许多特殊符号,这些符号中不蕴含有效信息,且会影响分词效果,所以需要去除。对于空格、换行、制表符等停顿的符号,也需要统一换成中文逗号。由于本次处理的是中文文本,所以文本的 阅读全文
posted @ 2023-03-10 15:48 乌漆WhiteMoon 阅读(1044) 评论(0) 推荐(1) 编辑
摘要:#爬虫对象选择 打开中国天气网站,例如我要爬取厦门近 40 天的天气情况,打开对应的网页。“weather40d”目录是近 40 天的天气,“101230201”是厦门城市的 id。 http://www.weather.com.cn/weather40d/101230201.shtml 打开开发者 阅读全文
posted @ 2021-11-17 13:39 乌漆WhiteMoon 阅读(992) 评论(0) 推荐(2) 编辑
摘要:#爬虫对象选择 打开中国天气网站,例如我要爬取厦门近 40 天的天气情况,打开对应的网页。“weather40d”目录是近 40 天的天气,“101230201”是厦门城市的 id。 http://www.weather.com.cn/weather40d/101230201.shtml 打开开发者 阅读全文
posted @ 2021-11-08 19:06 乌漆WhiteMoon 阅读(1601) 评论(0) 推荐(4) 编辑
摘要:#爬虫对象选择 打开软科中国大学排名,观察这个页面结构复杂且一页只显示了 30 所大学。 而且点击了翻页,发现 url 没有发生变化,说明该页面有可能是已经获取了所有数据,然后使用 JavaScript 动态生成。此时可能就很麻烦了,因为没有办法通过 get 传参的方式来切换网页进行爬取。 从开发者 阅读全文
posted @ 2021-11-06 13:53 乌漆WhiteMoon 阅读(5273) 评论(11) 推荐(4) 编辑
摘要:#Pandas Pandas 是基于 NumPy 的分析结构化数据的工具集,它用于数据挖掘和数据分析,同时也提供数据清洗功能。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas 库有 2 个主要的工具,分别是 DataFrame 对象和 Series 阅读全文
posted @ 2021-03-12 09:53 乌漆WhiteMoon 阅读(50384) 评论(0) 推荐(1) 编辑
摘要:本文仅介绍 ndarray 对象的基本操作,更多数学运算功能可以查阅说明文档或其他教程使用。 #Numpy NumPy(Numerical Python) 是 Python 的一个开源数值计算扩展库,可以用于大量的维度数组与矩阵的存储于运算,同时对数组运算提供大量的数学函数。相比 Python 本身 阅读全文
posted @ 2021-03-07 21:42 乌漆WhiteMoon 阅读(444) 评论(0) 推荐(2) 编辑
摘要:#概述 Graphviz 是一款由 AT&T Research 和 Lucent Bell 实验室开源的可视化图形工具,可以很方便的用来绘制结构化的图形网络,支持多种格式输出。Graphviz 输入是一个用 dot 语言编写的绘图脚本,通过对输入脚本的解析,分析出其中的点、边及子图,然后根据属性进行 阅读全文
posted @ 2020-06-29 22:18 乌漆WhiteMoon 阅读(30014) 评论(0) 推荐(7) 编辑
摘要:#TCP 协议 TCP 协议给使用者提供了两种服务,分别是面向连接的服务和可靠的数据传输服务,我们简单介绍一下。简单来说面向连接的含义是客户机和服务器之间需要建立连接,在位于应用层的数据开始交互之前,TCP 协议首先要先让客户机和服务器进行一次握手。这么做相当于告知彼此接下来需要进行数据的交互,请双 阅读全文
posted @ 2020-04-20 19:39 乌漆WhiteMoon 阅读(683) 评论(0) 推荐(2) 编辑
摘要:#UDP UDP 是一种不提供不必要服务的轻量级运输协议,它仅提供最小服务。UDP 是无连接的,因此在两个进程通信前没有握手过程。UDP 协议提供一种不可靠数据传输服务,也就是说,当一个进程讲一个报文发送进 UDP 套接字时,UDP 协议并不保证该报文将到达接收进程。不仅如此,到达接收进程的报文也可 阅读全文
posted @ 2020-04-20 01:37 乌漆WhiteMoon 阅读(482) 评论(0) 推荐(2) 编辑
摘要:[TOC] 面向对象程序设计 结构化程序设计的缺点 我们为什么要有面向对象程序设计呢?我们使用 C 语言只能实现结构化程序设计,所谓结构化程序设计就是“ 程序 = 数据结构 + 算法 ”,而在程序中会有很多可以相互调用的函数和全局变量。 但是我们可以显然地看出,这种编程风格存在不少缺点。首先由于函数 阅读全文
posted @ 2020-04-17 21:27 乌漆WhiteMoon 阅读(678) 评论(0) 推荐(2) 编辑
摘要:[TOC] 由于我刚开始学习Python时,被序列结构转晕了,所以写了这篇博客。 字典 导言 随便翻开一本英语单词书,你就会看到这样的画面: 我们能观察到,这页单词书的排版方式是左边一个单词,右边是它的意思,单词和意思是相互对应的,这种排版方式可以帮助我们很好地理解字典结构。 什么是字典 字典是一系 阅读全文
posted @ 2020-02-09 17:16 乌漆WhiteMoon 阅读(561) 评论(4) 推荐(2) 编辑
摘要:[TOC] 由于我刚开始学习Python时,被序列结构转晕了,所以写了这篇博客。 列表 导言 例如我们打开PTA网站,随便打开一个题目集,我们可以查看一个叫题目列表的页面,如图所示,在这个列表中,我们可以看到这个列表展示了我们需要练习的题目,Python中的列表结构就与这个例子类似。 什么是列表 列 阅读全文
posted @ 2020-02-08 17:45 乌漆WhiteMoon 阅读(772) 评论(2) 推荐(3) 编辑