个人博客转至:tybai.com

无聊就想打码,打码使我快乐


Fork me on GitHub

随笔分类 - 机器学习

【机器学习】算法原理详细推导与实现(三):朴素贝叶斯
摘要:【机器学习】算法原理详细推导与实现(三):朴素贝叶斯 在上一篇算法中,逻辑回归作为一种二分类的分类器,一般的回归模型也是是判别模型,也就根据特征值来求结果概率。形式化表示为 $p(y|x;\theta)$,在参数 $\theta$ 确定的情况下,求解条件概率 $p(y|x)$ 。通俗的解释为:在给定 阅读全文

posted @ 2019-07-05 10:09 TTyb 阅读 (498) | 评论 (0) 编辑

【机器学习】算法原理详细推导与实现(二):逻辑回归
摘要:【机器学习】算法原理详细推导与实现(二):逻辑回归 在上一篇算法中,线性回归实际上是 连续型 的结果,即 $y\in R$ ,而逻辑回归的 $y$ 是离散型,只能取两个值 $y\in \{0,1\}$,这可以用来处理一些分类的问题。 logistic函数 我们可能会遇到一些分类问题,例如想要划分 鸢 阅读全文

posted @ 2019-06-25 10:19 TTyb 阅读 (459) | 评论 (4) 编辑

【机器学习】算法原理详细推导与实现(一):线性回归
摘要:【机器学习】算法原理详细推导与实现(一):线性回归 今天我们这里要讲第一个有监督学习算法,他可以用于一个回归任务,这个算法叫做 线性回归 房价预测 假设存在如下 组房价数据: | 面积(m^2)| 价格(万元) | |: :|: :| | 82.35 | 193 | | 65.00 | 213 | 阅读全文

posted @ 2019-06-13 10:49 TTyb 阅读 (523) | 评论 (3) 编辑

基于漫威系列电影好看程度排序
摘要:引申问题 在选择电影时,如果热门电影A有 人观众打分,冷门电影B有 个人打分,他们的豆瓣评分都是 分,怎么比较两部电影的好坏?平时我们都有一种感觉,很多人去评价,这个东西就更可信,只有一两个人说好,可能是托,那么感觉上是电影A更好。 再例如《漫威》系列电影中,距离《复仇者联盟4》上映一周,豆瓣分都是 阅读全文

posted @ 2019-04-29 11:18 TTyb 阅读 (1431) | 评论 (0) 编辑

马尔科夫链
摘要:为了预测天气,假设观察多次后,得到天气变化的概率存在如下转换: 第一天|第二天|概率 : :|: :|: : 晴天|晴天|0.2 晴天|阴天|0.3 晴天|雨天|0.5 阴天|晴天|0.1 阴天|阴天|0.6 阴天|雨天|0.3 雨天|晴天|0.4 雨天|阴天|0.5 雨天|雨天|0.1 那么转移概 阅读全文

posted @ 2018-09-28 10:58 TTyb 阅读 (84) | 评论 (0) 编辑

用sklearn封装的kmeans库
摘要:由于需要海量的进行聚类,所以将 算法自我封装成一个方便利用的库,可以直接调用得到最优的 和 : 调用的时候直接可以: 测试数据: 阅读全文

posted @ 2017-02-26 10:15 TTyb 阅读 (192) | 评论 (0) 编辑

朴素贝叶斯算法
摘要:最为广泛的两种分类模型是 "决策树模型(Decision Tree Model)" 和 "朴素贝叶斯模型(Naive Bayesian Model,NBM)" 。 朴素贝叶斯算法思路 朴素贝叶斯法是基于 的分类方法,按照以前 "决策树" 的数据,利用朴素贝叶斯进行分类: 假设存在如下一组信息: | 阅读全文

posted @ 2017-01-16 10:52 TTyb 阅读 (160) | 评论 (0) 编辑

决策树ID3算法
摘要:`决策树 决策树 决策树 决策树` 是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念,本文着重讲ID3算法。 假设存在如下一组信息: | 天气 | 气温 | 湿度 阅读全文

posted @ 2017-01-13 09:54 TTyb 阅读 (110) | 评论 (0) 编辑

Agens层次聚类
摘要:层次聚类是另一种主要的聚类方法,它具有一些十分必要的特性使得它成为广泛应用的聚类方法。它生成一系列嵌套的聚类树来完成聚类。单点聚类处在树的最底层,在树的顶层有一个根节点聚类。根节点聚类覆盖了全部的所有数据点。层次聚类分为两种: 合并(自下而上)聚类(agglomerative) 分裂(自上而下)聚类 阅读全文

posted @ 2017-01-09 10:50 TTyb 阅读 (311) | 评论 (0) 编辑

KNN近邻算法
摘要:"邻近算法 百度百科" KNN近邻算法思想 根据上文 "K means" 算法分类,可以将一堆 的样本分成N个簇,如下: 上图中红色代表一个分簇,绿色代表另一个分簇,这两个簇现在可以称呼为 ,现在突然出现了一个 黄色的四边形 ,如下: 该 黄色的四边形 现在还不知道属于哪一个分簇。选取 黄色的四边形 阅读全文

posted @ 2017-01-05 15:15 TTyb 阅读 (180) | 评论 (0) 编辑

K-means聚类算法
摘要:K means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K means算法以 作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用 准则函数作为聚类准则函数。 阅读全文

posted @ 2017-01-04 17:59 TTyb 阅读 (708) | 评论 (0) 编辑

FP-tree推荐算法
摘要:推荐算法大致分为: 1. 基于物品和用户本身 2. 基于关联规则 3. 基于模型的推荐 基于物品和用户本身 基于关联规则 基于模型的推荐 其实在现在的推荐系统中,很少有只使用了一个推荐策略的推荐引擎,一般都是在不同的场景下使用不同的推荐策略从而达到最好的推荐效果,例如 Amazon 的推荐,它将基于 阅读全文

posted @ 2017-01-03 16:44 TTyb 阅读 (370) | 评论 (0) 编辑

apriori推荐算法
摘要:大数据时代开始流行推荐算法,所以作者写了一篇教程来介绍apriori推荐算法。 推荐算法大致分为: 1. 基于物品和用户本身 2. 基于关联规则 3. 基于模型的推荐 基于物品和用户本身 基于关联规则 基于模型的推荐 其实在现在的推荐系统中,很少有只使用了一个推荐策略的推荐引擎,一般都是在不同的场景 阅读全文

posted @ 2016-12-28 16:09 TTyb 阅读 (1332) | 评论 (0) 编辑

Amazon验证码机器算法识别
摘要:Amazon验证码识别 在破解Amazon的验证码的时候,利用机器学习得到验证码破解精度超过70%,主要是训练样本不够,如果在足够的样本下达到90%是非常有可能的。 update后,样本数为2800多,破解精度达到90%以上,perfect! 文档结构为 需要的库 or 必须文件下载地址 "Amaz 阅读全文

posted @ 2016-12-10 18:20 TTyb 阅读 (2979) | 评论 (1) 编辑

python3验证码机器学习
摘要:python3验证码机器学习 文档结构为 需要的库 or 必须文件下载地址 "python3验证码机器学习" 1.读取图片,打印图片的结构直方图 打印结果为 该数组长度为255,每一个元素代表(0 255)颜色的多少,例如最后一个元素为625,即255(代表的是白色)最多,组合在一起 打印结果为 将 阅读全文

posted @ 2016-12-09 11:18 TTyb 阅读 (6834) | 评论 (3) 编辑

导航


不用多久

我就会升职加薪

当上总经理

出任CEO

迎娶白富美

走上人生巅峰

Pulpit rock