上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 45 下一页
摘要: 在机器学习中,我们非常关心模型的预测能力,即模型在新数据上的表现,而不希望过拟合现象的的发生,我们通常使用正则化(regularization)技术来防止过拟合情况。正则化是机器学习中通过显式的控制模型复杂度来避免模型过拟合、确保泛化能力的一种有效方式。如果将模型原始的假设空间比作“天空”,那么天空 阅读全文
posted @ 2024-05-20 18:20 郝hai 阅读(754) 评论(0) 推荐(0)
摘要: 逻辑回归(Logistic Regression),又称为 logistic 回归分析,是一种广义的线性回归模型,通常用于解决分类问题。虽然名字里有“回归”,但实际上它属于机器学习中的监督学习方法。逻辑回归最初用于解决二分类问题,它也可以通过一些技巧扩展到多分类问题。在实际应用中,我们通常使用给定的 阅读全文
posted @ 2024-05-11 10:51 郝hai 阅读(2537) 评论(0) 推荐(0)
摘要: 异常检测(Anomaly detection)是机器学习的常见应用,其目标是识别数据集中的异常或不寻常模式。尽管通常被归类为非监督学习问题,异常检测却具有与监督学习相似的特征。在异常检测中,我们通常处理的是未标记的数据,即没有明确的标签指示哪些样本是异常的。相反,算法需要根据数据本身的特征来确定异常 阅读全文
posted @ 2024-05-08 20:12 郝hai 阅读(2272) 评论(0) 推荐(0)
摘要: 社交媒体充斥着我们生活的时代,其已经成为了人们交流、获取信息、建立关系的重要平台。无论是微信、微博、抖音等,还是其他社交媒体,都构成了庞大而复杂的社交网络。在这个网络中,我们关注着各种KOL(Key Opinion Leader,关键意见领袖),同时也有自己的粉丝,形成了一个错综复杂的社交关系网。随 阅读全文
posted @ 2024-05-07 08:20 郝hai 阅读(659) 评论(0) 推荐(1)
摘要: Scikit-learn(简称为sklearn)是一个开源的Python机器学习库,提供了丰富而强大的工具,用于数据挖掘和数据分析。它的发展始于2007年,由David Cournapeau在Google Summer of Code项目中启动,后续得到了许多开发者的贡献,包括法国国家信息与自动化研 阅读全文
posted @ 2024-05-03 11:01 郝hai 阅读(3714) 评论(0) 推荐(0)
摘要: 社会网络分析(Social Network Analysis, SNA)在人类学、心理学、社会学、数学以及统计学等领域中发展起来,是综合运用图论、数学模型来研究社会行动者之间的关系或通过这些关系流动的各种有形或无形的东西,如信息、资源等,近年来逐渐成为一种热门的社会科学研究方法。社会网络分析旨在理解 阅读全文
posted @ 2024-05-02 23:36 郝hai 阅读(4736) 评论(1) 推荐(0)
摘要: 特征重要性评估(Variable importance measure, or Feature importance evaluation,VIM)用来计算样本特征的重要性,定量地描述特征对分类或者回归的贡献程度。随机森林(Random Forest)作为一种强大的机器学习算法,在特征重要性评估方面 阅读全文
posted @ 2024-05-02 23:35 郝hai 阅读(9406) 评论(0) 推荐(0)
摘要: AdaBoost是Freund和Schapire于1996年提出的一种集成学习方法。它的核心思想是通过迭代训练一系列弱分类器,每次调整样本权重以便更好地拟合被前一轮分类器错误分类的样本,从而构建一个强分类器。最终的模型是基于这些弱分类器的加权组合。AdaBoost广泛应用于二分类和多分类问题,尤其在 阅读全文
posted @ 2024-05-02 22:45 郝hai 阅读(351) 评论(0) 推荐(0)
摘要: 随机森林(Random Forest)是一种强大的集成学习方法,将多个决策树组合成一个更为强大和稳健的模型,适用于分类和回归任务。其核心思想是通过构建大量决策树,每棵树都基于不同的随机样本和特征子集进行训练,最后通过投票或平均的方式综合所有树的预测结果。这样做的好处在于增加了模型的多样性,减少了过拟 阅读全文
posted @ 2024-04-28 20:45 郝hai 阅读(487) 评论(0) 推荐(0)
摘要: 支持向量机(Support Vector Machine,SVM)是一种强大的监督学习算法,用于分类和回归任务。其核心思想是在高维空间中找到一个最优的超平面,将不同类别的数据分开。SVM的关键在于找到支持向量,即离超平面最近的数据点,这些支持向量决定了超平面的位置和方向。SVM通过最大化支持向量与超 阅读全文
posted @ 2024-04-28 16:50 郝hai 阅读(1963) 评论(0) 推荐(0)
上一页 1 ··· 22 23 24 25 26 27 28 29 30 ··· 45 下一页