摘要: 在数据处理相关工作中,读取的数据中常常会有缺失值的情况,为顺利进行后续的操作,需要首先对缺失值进行处理,处理的方式一般为删除或填充,Python中提供了专门的工具包,可以方便地进行实现。读取操作可以由pandas模块实现,通常直接读一个excel或csv文件,创建为DataFrame对象,模块中的d 阅读全文
posted @ 2023-11-28 23:55 归去_来兮 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 均值滤波、中值滤波、高斯滤波是三种常见的平滑滤波方法,其中均值滤波和高斯滤波是线性技术,中值滤波是非线性技术。它们实现的基本原理是基本一致的,指定一个滑动窗口,计算其中的均值、中值、卷积值输出到当前位置。 均值滤波、高斯滤波对高斯噪声表现较好,但对椒盐噪声表现较差;中值滤波则对椒盐噪声表现较好,对高斯噪声表现较差。 阅读全文
posted @ 2023-08-10 00:41 归去_来兮 阅读(270) 评论(0) 推荐(0) 编辑
摘要: DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,簇集的划定完全由样本的聚集程度决定。聚集程度不足以构成簇落的那些样本视为噪声点,因此DBSCAN聚类的方式也可以用于异常点的检测。 阅读全文
posted @ 2023-08-05 18:49 归去_来兮 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 常见的距离有曼哈顿距离、欧式距离、切比雪夫距离、闵可夫斯基距离、汉明距离、余弦距离等,用Python实现计算的方式有多种,可以直接构造公式计算,也可以利用内置线性代数函数计算,还可以利用scipy库计算。 ### 1.曼哈顿距离 也叫城市街区距离,是两点差向量的L1范数,也就是各元素的绝对值之和。A 阅读全文
posted @ 2023-08-02 23:19 归去_来兮 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 在一个字符串中,有时需对其中某些内容进行模糊匹配以实现条件的判定,如在“你好,hello,world”中判断是否含有“llo”。Python中通过re.search()方法实现,特别地,对于首位起始的内容匹配,也可通过re.match()方法实现。若匹配成功,它们返回一个re.Match对象;若匹配 阅读全文
posted @ 2023-04-15 19:59 归去_来兮 阅读(2132) 评论(0) 推荐(0) 编辑
摘要: ## 一、概述 当前人工智能技术实现的一种主要手段是机器学习,而机器学习能够解决的问题主要有三种:分类、聚类、回归,有监督的是分类,无监督的是聚类。所谓聚类,就是以一定的方法将一堆样本依它们本身的数据特性划分成不同的簇类,以达成不同的技术目的,k-means就是这样一种基础聚类算法。 ## 二、算法 阅读全文
posted @ 2023-01-30 18:52 归去_来兮 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 一、朴素贝叶斯法原理 1.基本原理 朴素贝叶斯法(Naive Bayes)是一种基础分类算法,它的核心是贝叶斯定理+条件独立性假设。贝叶斯定理描述的是两个条件概率之间的关系,对两个事件A和B,由乘法法则易知$$P(A∩B)=P(A)P(B│A)=P(B)P(A│B)$$ 贝叶斯定理就是对这个关系式的 阅读全文
posted @ 2023-01-27 22:06 归去_来兮 阅读(341) 评论(0) 推荐(0) 编辑
摘要: kNN(k nearest neighbor,k近邻)是一种基础分类算法,基于“物以类聚”的思想,将一个样本的类别归于它的邻近样本。 阅读全文
posted @ 2023-01-07 18:47 归去_来兮 阅读(153) 评论(0) 推荐(0) 编辑
摘要: 在图像处理相关的问题中,图像对准是一类典型的问题,也就是要将两幅图严丝合缝地对应起来。通常来讲,两幅图大小不一,一个是模板,一个是母图,也就是要在母图中搜寻定位到与模板图最为接近的区域。 阅读全文
posted @ 2023-01-02 12:20 归去_来兮 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 在运行matlab程序的过程中,有时候需要实时地掌握程序运行的进度,尤其对于一些耗时较长的循环操作,能够及时地输出运行进度,显得非常有必要。 打印进度条的实现方式就是不断地退格、输出。 退格字符是'\b',每输出一个退格符,屏幕上的内容便回退一格,而实际的进度条展示往往是多个字符,可利用repmat 阅读全文
posted @ 2022-07-15 22:10 归去_来兮 阅读(331) 评论(0) 推荐(0) 编辑