摘要: 一、PCA原理: •主成分分析(Principal Components Analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维 阅读全文
posted @ 2020-04-23 16:34 蜘蛛侠不会飞 阅读(668) 评论(0) 推荐(0)
摘要: 所有的剑指offer中的算法题的python实现可以查看: 第一部分 第二部分 第三部分 ​ 最好自己画图和创建虚拟数据进行理解。 目录 1. 输入某年某月某日,判断这是这一年的第几天 2.打印出 5 种不同形式的九九乘法表 3.判断101 - 200 之间有多少个素数, 并输出所有的素数 5.一球 阅读全文
posted @ 2020-04-23 16:32 蜘蛛侠不会飞 阅读(780) 评论(0) 推荐(1)
摘要: ​ 在介绍Python的self用法之前,先来介绍下Python中的类和实例…… 我们知道,面向对象最重要的概念就是类(class)和实例(instance),类是抽象的模板,比如学生这个抽象的事物,可以用一个Student类来表示。而实例是根据类创建出来的一个个具体的“对象”,每一个对象都从类中继 阅读全文
posted @ 2020-04-23 16:31 蜘蛛侠不会飞 阅读(2936) 评论(0) 推荐(1)
摘要: form:https://zhidao.baidu.com/question/1958192745292032580.html ​ return 会直接另函数返回,函数就运行结束了,所有该函数体内的代码都不再执行了,所以该函数体内的循环也不可能再继续运行。 如果你需要让循环继续执行,就不能retur 阅读全文
posted @ 2020-04-23 16:29 蜘蛛侠不会飞 阅读(454) 评论(0) 推荐(0)
摘要: ​ 1、树的概念: 树(Tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点: 每个节点有零 阅读全文
posted @ 2020-04-23 16:28 蜘蛛侠不会飞 阅读(237) 评论(0) 推荐(0)
摘要: 1.K-Means 算法: KMeans(n_clusters, init, n_init, max_iter, tol, precompute_distances, verbose, random_state, copy_x, n_jobs, algorithm) KMeans类的主要参数有: 1 阅读全文
posted @ 2020-04-23 16:23 蜘蛛侠不会飞 阅读(2528) 评论(0) 推荐(1)
摘要: pandoc是一款开源转换工具,可以实现常见的格式转换。支持全平台操作,以命令行的方式进行转换。 下载地址,根据系统的不同选择不同的安装方式。 使用 # 打开终端窗口,windows下打开cmd # 小试牛刀,将input.txt文件转换为output.html文件。-o参数表示输出文件 pando 阅读全文
posted @ 2020-04-23 16:22 蜘蛛侠不会飞 阅读(619) 评论(0) 推荐(0)
摘要: 使用python依次读取文件中的所有csv格式的数据: #coding=gbk import pandas as pd import os path = r'D:\ml_datasets\PHM\c6' def get_file(): #创建一个空列表 files =os.listdir(path) 阅读全文
posted @ 2020-04-23 16:06 蜘蛛侠不会飞 阅读(4179) 评论(0) 推荐(0)
摘要: 尺度函数 : scaling function (在一些文档中又称为父函数 father wavelet )小波函数 : wavelet function(在一些文档中又称为母函数 mother wavelet)连续的小波变换 :CWT离散的小波变换 :DWT小波变换的基本知识:不同的小波基函数,是 阅读全文
posted @ 2020-04-23 16:05 蜘蛛侠不会飞 阅读(11591) 评论(0) 推荐(0)
摘要: 一、前言 在现实生活和工作中,噪声无处不在,在许多领域中,如天文、医学图像和计算机视觉方面收集到的数据常常是含有噪声的。噪声可能来自获取数据的过程,也可能来自环境影响。由于种种原因,总会存在噪声,噪声的存在往往会掩盖信号本身所要表现的信息,所以在实际的信号处理中,常常需要对信号进行预处理,而预处理最 阅读全文
posted @ 2020-04-23 16:04 蜘蛛侠不会飞 阅读(2306) 评论(0) 推荐(0)
摘要: 频谱图的横轴表示的是 频率, 纵轴表示的是振幅 #coding=gbk import numpy as np import pandas as pd import matplotlib.pyplot as plt #依据快速傅里叶算法得到信号的频域 def test_fft(): sampling_ 阅读全文
posted @ 2020-04-23 16:03 蜘蛛侠不会飞 阅读(9787) 评论(0) 推荐(0)
摘要: form:https://www.cnblogs.com/doodle777/p/4951096.html LaTeX 中插入数学公式 一、常用的数学符号 1、小写希腊字母 ​ \alpha ​ \nu ​ \beta ​ \xi ​ \gamma ​ o ​ \delta ​ \pi ​ \eps 阅读全文
posted @ 2020-04-23 16:00 蜘蛛侠不会飞 阅读(874) 评论(0) 推荐(0)
摘要: FROM: https://blog.csdn.net/zhang0558/article/details/76019832 小波变换和小波阈值法去噪 1. 小波变换 小波变换是一种信号的时间——尺度(时间——频率)分析方法,它具有多分辨分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种 阅读全文
posted @ 2020-04-23 15:58 蜘蛛侠不会飞 阅读(2041) 评论(0) 推荐(0)
摘要: 常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法。 1. 对数变换 即将原始数据X的对数值作为新的分布数据:X’=lgX当原始数据中有小值及零时,亦可取X’=lg(X+1)还可根据需要选用X’=lg(X+k)或X’=lg(k-X) 对数变换 阅读全文
posted @ 2020-04-23 15:55 蜘蛛侠不会飞 阅读(2943) 评论(0) 推荐(0)
摘要: 1.下载安装PyInstaller cmd打开命令行:pip install pyinstaller 安装完成后输入: python import PyInstaller 如未报错,则代表安装成功。 2.打包程序 直接打开需要打包的.py 的 文件目录下,按住shift, +点击右键: 出现‘在此处 阅读全文
posted @ 2020-04-23 15:54 蜘蛛侠不会飞 阅读(4868) 评论(0) 推荐(0)
摘要: 实现本次博文的功能花了有点时间呀。。。。。。。。。。。。。。。 使用的编程语言是python3.4, 界面设计软件是erics 6结合PyQt5 ​ 1、使用QT Designer实现UI 界面 在eric 6 中,点击项目,新建一个项目,增加如下图的一些控件与布局,不相同都可以。 ​ 除了 QVB 阅读全文
posted @ 2020-04-23 15:53 蜘蛛侠不会飞 阅读(2202) 评论(0) 推荐(0)
摘要: 1.异常处理机制 def test(x): try: y = 10 / x print(y) #except Exception as e: #print(e) #可以打印出异常的类型 except ZeroDivisionError: #抛出异常,执行下面的程序,如果是界面软件可以弹出一个窗口,提 阅读全文
posted @ 2020-04-23 15:52 蜘蛛侠不会飞 阅读(3554) 评论(0) 推荐(0)
摘要: 有时候,我们需要定时对数据进行刷新,以获取到最新的数据,然后对数据进行处理, 这时候可以采用PyQT5 中的QTimer 类。但是,有时我们并不知道这段代码会执行多长的时间,有时候会超过我们设定的刷新的时间,如 self.timer.start(1000)是1 秒的话,或者是我们不知道代码执行多久。 阅读全文
posted @ 2020-04-23 15:51 蜘蛛侠不会飞 阅读(2831) 评论(0) 推荐(0)
摘要: pyinstaller安装,简单打包可以参考:https://blog.csdn.net/qq_40587575/article/details/85076934 pyinstaller [参数] [要打包的程序.py] 参数说明:–icon=图标路径-F 打包成一个exe文件-w 使用窗口,无控制 阅读全文
posted @ 2020-04-23 15:49 蜘蛛侠不会飞 阅读(4696) 评论(0) 推荐(0)
摘要: MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式。 ​ 读取3个数据集: #coding=gbk # MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。 阅读全文
posted @ 2020-04-23 15:47 蜘蛛侠不会飞 阅读(2119) 评论(0) 推荐(0)
摘要: 目录 1.逻辑回归 2.支持向量机 3.决策树 4.KNN算法 5.朴素贝叶斯算法 6.随机森林 7.AdaBoost算法 8.GBDT算法 9.XGBoost 10.人工神经网络 1.逻辑回归 二项logistic回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的logisti 阅读全文
posted @ 2020-04-23 15:45 蜘蛛侠不会飞 阅读(4171) 评论(0) 推荐(0)
摘要: 时间序列(time series)数据是一种重要的结构化数据形式,。在多个时间点观察或测量到的任何时间都可以形成一段时间序列。很多时间, 时间序列是固定频率的, 也就是说, 数据点是根据某种规律定期出现的(比如每15秒。。。。)。时间序列也可以是不定期的。时间序列数据的意义取决于具体的应用场景。主要 阅读全文
posted @ 2020-04-23 15:43 蜘蛛侠不会飞 阅读(482) 评论(0) 推荐(0)
摘要: There are two major differences between the transform and apply groupby methods. apply implicitly passes all the columns for each group as a DataFrame 阅读全文
posted @ 2020-04-23 15:42 蜘蛛侠不会飞 阅读(1264) 评论(0) 推荐(0)
摘要: 数据集来源:1. 2013-14 NBA Schedule and Results 2.2013年 NBA 赛季排名情况 参考书籍:《Python数据挖掘入门与实践》 1.加载数据集: 使用pandas加载数据集,有1319行数据, 8个特征, 查看前5项数据集,并查找是否有重复数据 #coding 阅读全文
posted @ 2020-04-23 15:39 蜘蛛侠不会飞 阅读(1136) 评论(0) 推荐(0)
摘要: pipeline管道机制使用方法: 流水线的输入为一连串的数据挖掘步骤,其中最后一步必须是估计器(Estimator),可理解成分类器前几步是转换器(Transformer)。输入的数据集经过转换器的处理后,输出的结果作为下一步的输入。 最后,用位于流水线最后一步的估计器对数据进行分类。 每一步都用 阅读全文
posted @ 2020-04-23 15:28 蜘蛛侠不会飞 阅读(2119) 评论(0) 推荐(0)
摘要: •1.SVM 的基本思想: •SVM把分类问题转换成寻求分类平面的问题,并通过最大化分类边界点到分类平面的距离来实现分类。通俗的讲支持向量机的解决的问题是找到最好的分类超平面。支持向量机(Support vector machine)通常用来解决二分类问题 ​ 2.构造目标函数 类似于点到直线的距离 阅读全文
posted @ 2020-04-23 15:26 蜘蛛侠不会飞 阅读(916) 评论(0) 推荐(0)
摘要: 1. 算法核心思想: 通过计算每个训练样本到待分类样本的距离,选取和待分类样本的距离最近的 K 个训练样本,K个样本中那个类别的训练样本占据着多数, 则表明待分类的样本就属于哪一个类别。 KNN算法在类别的决策中, 只与极少数的相邻样本相关。因此,对于类别的样本交叉或重叠较多的待分类样本集来说, K 阅读全文
posted @ 2020-04-23 15:24 蜘蛛侠不会飞 阅读(502) 评论(0) 推荐(0)
摘要: 1.什么是决策树: 决策树是以树状结构表示数据分类的结果 ​ 非叶子结点代表测试的条件。 分支代表测试的结果 2.如何构建决策树: ´1.信息熵(informationentropy):是度量样本集合纯度最常用的一种指标。 ​ 2.基尼系数(gini):是度量样本集合不确定性指标。(基尼指数与熵可近 阅读全文
posted @ 2020-04-23 15:22 蜘蛛侠不会飞 阅读(587) 评论(0) 推荐(0)
摘要: 逻辑回归的基本过程:a建立回归或者分类模型 >b 建立代价函数 > c 优化方法迭代求出最优的模型参数 >d 验证求解模型的好坏。 1.逻辑回归模型: 逻辑回归(Logistic Regression):基于线性回归的分类算法。一般用于解决二分类问题。 线性回归模型如下:​ 逻辑回归思想是基于线性回 阅读全文
posted @ 2020-04-23 15:19 蜘蛛侠不会飞 阅读(996) 评论(0) 推荐(0)
摘要: 1.栈 #coding=gbk #栈的常用操作 # Stack() 建立一个空的栈对象 # push() 把一个元素添加到栈的最顶层 # pop() 删除栈最顶层的元素,并返回这个元素 # peek() 返回最顶层的元素,并不删除它 # isEmpty() 判断栈是否为空 # size() 返回栈中 阅读全文
posted @ 2020-04-23 15:12 蜘蛛侠不会飞 阅读(303) 评论(0) 推荐(0)

俺的博客

https://blog.csdn.net/qq_40587575

俺的公众号