机器学习:模型评估与优化 过拟合、欠拟合、数据分离、混淆矩阵
摘要:一、过拟合与欠拟合 1、回归任务的过拟合和欠拟合 拟合反应速率(rate)与温度(temperature)数据,预测85度时的反应速率。 (1)、good fit 好的模型的预测结果如下图,即开口向下的抛物线, 这是一个回归的任务,由于数据点不符合线性分布,故不是线性回归,可以理解为多项式回归,即二
阅读全文
posted @
2025-02-20 11:50
周文豪
阅读(322)
推荐(0)
机器学习-监督学习之降维算法(PCA)
摘要:一、降维算法概述 1.降维算法概述 降维就是一种针对高维度特征进行的数据预处理方法,是应用非常广泛的数据预处理方法。 降维算法指对高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,在一定的信息损失范围内,降维可以节省大量的时间和成本。
阅读全文
posted @
2025-02-12 16:02
周文豪
阅读(173)
推荐(0)
机器学习-监督学习之决策树算法ID3
摘要:一、决策树(Decision Tree) 1、逻辑回归VS决策树 任务:根据用户的学习动力、能力提升意愿、兴趣度、空余时间,判断其是否适合学习本门课程。 (1)、如果用逻辑回归模型框架 逻辑回归是把四个属性直接丢给模型,建立逻辑回归的方程,预测出对应分类的概率。 (2)、如果用决策树模型框架 问:想
阅读全文
posted @
2025-02-12 11:43
周文豪
阅读(117)
推荐(0)
机器学习:异常检测(概率密度)
摘要:一、异常检测(Anomaly Detection) 识别数据中异常的数据点 任务一:根据设备上传感器1与2的数据自动监测设备异常工作状态 其中:sensor就是传感器的意思。 任务二:自动寻找图片中异常的目标 更多案例: (1)、异常消费检测(商业) (2)、劣质产品检测(工业) (3)、缺陷基因检
阅读全文
posted @
2025-02-12 11:39
周文豪
阅读(184)
推荐(0)
机器学习-无监督学习之聚类clustering(KMeans和MeanShift)
摘要:一、无监督学习Unsupervised Learning 1、无监督学习 任务:下边六个实例,根据自己喜欢的方式分成两组 让计算机将下面的六张图片分成两类 方式一:站着(1、2)或坐着(3、4、5、6)方式二:全身(1、2、3)或半身(4、5、6)方式三:蓝眼球(1、2、3、5)或不是蓝眼球(4、6
阅读全文
posted @
2025-02-10 23:37
周文豪
阅读(335)
推荐(0)
机器学习-监督学习之逻辑回归
摘要:一、分类问题Classification 分类案例 1、实例:垃圾邮件检测 任务输入:电子邮件输出:此为垃圾邮件/普通邮件 流程(1)、标注样本邮件为垃圾/普通邮件(人) (2)、获取批量的样本邮件及其标签,学习其特征(计算机) (3)、针对新的邮件,自动判断其类别(计算机) 特征用于帮助判断是否为
阅读全文
posted @
2025-02-10 11:55
周文豪
阅读(182)
推荐(0)
机器学习-监督学习之线性回归
摘要:一、机器学习介绍 1、什么是机器学习? 机器学习是实现人工智能的最主流方法。它涉及到算法和统计模型的使用,使得计算机系统能够从数据中“学习”和改进任务的执行,而不是通过明确的编程来实现。机器学习包括多种技术,如线性回归、支持向量机(SVM)、决策树等。 第十个月的工资:y0*1.19 把月份和工资数
阅读全文
posted @
2025-02-08 14:31
周文豪
阅读(125)
推荐(0)