上一页 1 2 3 4 5 6 7 8 9 ··· 11 下一页
摘要: 配置文件 settings """ logging配置 """ ### 日志格式 formatter_format = '%(asctime)s %(name)s %(filename)s:%(lineno)d %(levelname)s: %(message)s' ### 日志保存地址 user_ 阅读全文
posted @ 2020-12-14 13:10 最冷不过冬夜 阅读(99) 评论(0) 推荐(0) 编辑
摘要: Python 16期 Day13作业 题目1 编写文件修改功能,调用函数时,传入三个参数(修改的文件路径,要修改的内容,修改后的内容)既可完成文件的修改 #!/usr/bin/env python3 # -*- coding: UTF-8 -*- """题目作答区!""" def alter_fil 阅读全文
posted @ 2020-12-10 16:01 最冷不过冬夜 阅读(152) 评论(0) 推荐(0) 编辑
摘要: Python 16期 Day12作业 提示:如何选择合适的数据类型来记录状态??? 选取的类型是否可以明确标识事物的状态 存不是目的,存的目的是为了日后取出来用,并且方便的用 把自己想象成一台计算机,如果我是计算机,我会如何以何种形式把事物的状态记到脑子里,然后再去Python中找相应的数据类型来让 阅读全文
posted @ 2020-12-09 17:28 最冷不过冬夜 阅读(117) 评论(0) 推荐(0) 编辑
摘要: AdaBoost提升树原理 ​ 提升树算法与线性回归模型模型的思想类似,所不同的是该算法实现了多棵基础决策树f(x)的加权运算。最具代表性的提升树为AdaBoost算法。 ​ 对于AdaBoost算法而言,每棵基础决策树都是基于前一棵基础决策树的分类结果对样本点设置不同的权重。 如果在前一棵基础决策 阅读全文
posted @ 2020-11-20 14:58 最冷不过冬夜 阅读(808) 评论(0) 推荐(0) 编辑
摘要: 模型介绍 Kmeans聚类存在两个致命缺点,⼀是聚类效果容易受到异常样本点的影响;⼆是该 算法⽆法准确地将⾮球形样本进⾏合理的聚类。 基于密度的聚类则可以解决⾮球形簇的问题,“密度”可以理解为样本点的紧密程度, 如果在指定的半径领域内,实际样本量超过给定的最⼩样本量阈值,则认为是密度⾼的对 象,就可 阅读全文
posted @ 2020-11-20 14:56 最冷不过冬夜 阅读(855) 评论(0) 推荐(0) 编辑
摘要: 模型介绍 对于有监督的数据挖掘算法而言,数据集中需要包括标签变量(即因变量y的值)。 但在有些场景下并没有给定的y值。对于这类数据的建模,一般称为无监督的数据挖掘算法。 最为典型的当属聚类算法。 Kmeans聚类算法利用距离远近的思想将目标数据聚为指定的K个簇, 进而使样本呈现簇内差异小,簇间差异大 阅读全文
posted @ 2020-11-16 01:47 最冷不过冬夜 阅读(2583) 评论(0) 推荐(0) 编辑
摘要: 超平⾯的理解 在⼀维空间中,如需将数据切分为两段,只需要⼀个点即可; 在⼆维空间中,对于线性可分的样本点,将其切分为两类,只需⼀条直线即可; 在三维空间中,将样本点切分开来,就需要⼀个平⾯。 分隔带 “分割带”代表了模型划分样本点的能⼒或可信度。 “分割带”越宽,说明模型能够将样本点划分得越清晰,进 阅读全文
posted @ 2020-11-13 16:35 最冷不过冬夜 阅读(848) 评论(0) 推荐(0) 编辑
摘要: 模型思想 该分类器的实现思想⾮常简单,即通过已知类别的训练数据集,计算样本的先验概率, 然后利⽤⻉叶斯概率公式测算未知类别样本属于某个类别的后验概率, 最终以最⼤后验概率所对应的类别作为样本预测值。 先验概率 先验概率是指根据以往经验和分析得到的概率。如全概率公式,它往往作为“由应求果”问题中的“因 阅读全文
posted @ 2020-11-10 02:58 最冷不过冬夜 阅读(211) 评论(0) 推荐(0) 编辑
摘要: K近邻模型 K近邻模型既可以预测分类问题,也可以用于连续性变量预测问题。 模型的本质就是寻找k个最近样本,然后基于最近样本做“预测”。 对于离散型的因变量来说,从k个最近的已知类别样本中挑选出频率最高的类别用于未知样本的判断。 对于连续型的因变量来说,则是将k个最近的已知样本均值用作未知样本的预测。 阅读全文
posted @ 2020-11-06 03:38 最冷不过冬夜 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 信息熵 熵原本是物理学中的⼀个定义,后来⾹农将其引申到了信息论领域,⽤来表示信息量的⼤⼩。 信息量越⼤(分类越不“纯净”),对应的熵值就越⼤,反之亦然。 信息增益率 决策树中的ID3算法使⽤信息增益指标实现根节点或中间节点的字段选择,但是该指标存在⼀个⾮ 常明显的缺点,即信息增益会偏向于取值较多的字 阅读全文
posted @ 2020-11-01 22:10 最冷不过冬夜 阅读(263) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 11 下一页