摘要: 1、下载:https://digi.bib.uni-mannheim.de/tesseract/ 我们之所以要应用Tesseract,是因为他是一个开源的OCR(光学字符识别)引擎,它可以从各种图像中提取文本信息。 它具有以下作用: - 从扫描或拍摄的图像中提取文本:Tesseract可以从这些非结 阅读全文
posted @ 2024-06-11 18:11 little小新 阅读(234) 评论(0) 推荐(0)
摘要: #现有环境: vdb 1000G - vdb1 500G - 剩余500G需要加在vdb1上 # 1、安装 - yum install -y cloud-utils-growpart - 一般系统都自带 # 2、执行以下命令,使用 growpart 工具扩容分区 - growpart /dev/vd 阅读全文
posted @ 2024-06-11 15:59 little小新 阅读(71) 评论(0) 推荐(0)
摘要: Index类型,它为Series和DataFrame对象提供了索引服务,有了索引我们就可以排序数据(sort_index方法)、对齐数据(在运算和合并数据时非常重要)并实现对数据的快速检索(索引运算)。 由于DataFrame类型表示的是二维数据,所以它的行和列都有索引,分别是index和colum 阅读全文
posted @ 2024-06-10 15:24 little小新 阅读(123) 评论(0) 推荐(0)
摘要: 经过前面的学习,我们已经将数据准备就绪而且变成了我们想要的样子 接下来就是最为重要的数据透视阶段了。当我们拿到一大堆数据的时候,如何从数据中迅速的解读出有价值的信息 把繁杂的数据变成容易解读的统计图表并再此基础上产生业务洞察,这就是数据分析要解决的核心问题。 数据透视 # -*- coding: u 阅读全文
posted @ 2024-06-10 14:03 little小新 阅读(76) 评论(0) 推荐(0)
摘要: 在完成数据加载之后,我们可能需要对事实表和维度表进行连接,这是对数据进行多维度拆解的基础; 我们可能从不同的数据源加载了结构相同的数据,我们需要将这些数据拼接起来;我们把这些操作统称为数据重塑。 当然,由于企业的信息化水平以及数据中台建设水平的差异,我们拿到的数据未必是质量很好的,可能还需要对数据中 阅读全文
posted @ 2024-06-10 00:26 little小新 阅读(69) 评论(0) 推荐(0)
摘要: 如果使用 pandas 做数据分析,那么DataFrame一定是被使用得最多的类型,它可以用来保存和处理异质的二维数据。 这里所谓的“异质”是指DataFrame中每个列的数据类型不需要相同,这也是它区别于 NumPy 二维数组的地方。 DataFrame提供了极为丰富的属性和方法,帮助我们实现对数 阅读全文
posted @ 2024-06-09 22:31 little小新 阅读(118) 评论(0) 推荐(0)
摘要: Pandas 是 Wes McKinney 在2008年开发的一个强大的分析结构化数据的工具集。Pandas 以 NumPy 为基础(实现数据存储和运算) 提供了专门用于数据分析的类型、方法和函数,对数据分析和数据挖掘提供了很好的支持; 同时 pandas 还可以跟数据可视化工具 matplotli 阅读全文
posted @ 2024-06-09 17:47 little小新 阅读(108) 评论(0) 推荐(0)
摘要: 数组的运算 使用 NumPy 最为方便的是当需要对数组元素进行运算时,不用编写循环代码遍历每个元素,所有的运算都会自动的矢量化。简单的说就是,NumPy 中的数学运算和数学函数会自动作用于数组中的每个成员。 # -*- coding: utf-8 -*- #数组的运算 #使用 NumPy 最为方便的 阅读全文
posted @ 2024-06-09 15:37 little小新 阅读(116) 评论(0) 推荐(0)
摘要: 数组对象的方法应用 # -*- coding: utf-8 -*- #数组对象的方法 import matplotlib.pyplot as plt import numpy # 1、 获取描述统计信息 array1 = numpy.random.randint(1, 100, 10) print( 阅读全文
posted @ 2024-06-09 14:03 little小新 阅读(40) 评论(0) 推荐(0)
摘要: 1、安装python 数据分析的三大神器 pip install numpy pandas matplotlib NumpPy 的说明 Numpy 是一个开源的 Python 科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作、 对于同样的数值计算任务,使用 NumPy 不 阅读全文
posted @ 2024-06-09 02:16 little小新 阅读(84) 评论(0) 推荐(0)