随笔分类 -  机器学习与数据挖掘

机器学习相关
摘要:微积分 导数:当函数y=f(x)的自变量x在一点x0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x0)或df(x0)/dx。其图像表示为如下: 类似的概念还有:二维空间中的“切线”。 偏导数:当需要让其他变量不变,只 阅读全文
posted @ 2021-01-30 21:02 划水De雁小明 阅读(262) 评论(0) 推荐(0)
摘要:博客在前面几篇随笔中,介绍了在网络环境中浏览器和服务器之间交互的相关内容,下面主要主要从7个方面介绍一款网络抓包代理工具Fiddler,它可以帮助前端开发者和数据分析人员解决很多问题。 一、Fiddler设置(PC端) Fiddler默认是只能抓取http网络格式的,所以我们要先设置下使Fiddle 阅读全文
posted @ 2021-01-24 20:02 划水De雁小明 阅读(910) 评论(0) 推荐(0)
摘要:文本分析,在数据挖掘,甚至是深度学习中很重要的分支研究领域。如下运用R语言,通过采用文本相似度算法Jaro-Winkler Distance,能实现: 在题库中查找出相似度高的题并输出自动聚类的结果,从而提炼出练习重点,提高阅读效率。 ## 寻找练习重点 library('xlsx') librar 阅读全文
posted @ 2021-01-07 08:09 划水De雁小明 阅读(1633) 评论(0) 推荐(0)
摘要:一个重要的闭环: 机器学习-数据挖掘的流程(CRISP-DM):围绕数据进行如下6个活动进行闭环式地探索活动 商业理解 数据理解 数据准备 建立模型 模型评估 方案实施 一个重要的概念: 特征工程:最大限度地从原始数据中提取特征以供算法和模型使用,包括如下几个主要部分: 数据预处理:标准化、缩放、缺 阅读全文
posted @ 2021-01-02 22:18 划水De雁小明 阅读(339) 评论(0) 推荐(0)