随笔分类 - AI人工智能
机器学习、深度学习、推荐算法
摘要:1. 高等数学基础 函数的定义 量和量之间的关系如:A = π r2 ; y = f(x) 其中x是自变量,y是因变量; 函数在x0处取得的函数值y0 = y|x=x0 = f(x0) 符号只是一种表示,也可以 y = g(x)等 几种函数 分段函数: 几种特性 数列 极限 函数的连续型 导数 梯度
阅读全文
摘要:隐⻢尔科夫模型 1. 隐⻢尔科夫模型定义 解决的是从序列到序列的任务, 2. 概率计算算法 3. 学习算法 4. 预测算法 期望最大算法
阅读全文
摘要:蒸馏收敛 基于keras的知识蒸馏(Knowledge Distillation)-分类与回归 如果通过蒸馏收敛到一个更优的的部署模型 Knowledge Distillation Introduction to Knowledge Distillation 知识提取是一种模型压缩过程,其中对小(学
阅读全文
摘要:word2vec 单词向量化表示 word2vec 下分为两个模型CBOW与Skip-gram ,分别包含Hierarchical Softmax和 Negative Sampling两个方法; 1. 连续词袋模型(CBOW)与跳字模型(Skip-gram) 单词W; 词典D = {W1, W2,
阅读全文
摘要:图像的一般问题Caffe很方便,是目前产品化最多的库; 多关注TensorFlow,社区发达资源多; 可以关注Facebook的Pytorch + caffe2,研究+产品应用组合; MxNet对显存利用率很高,而且Amazon也大力支持; Caffe 来源于Berkeley的开源框架 高效、一般的
阅读全文
摘要:循环神经网络 CV是和image图片和视频打交道; NLP 自然语言处理是和文本打交道,文本天然的时序数据; 1. 场景与多种应用 模仿论文(生成序列) 模型Linux内核代码“写程序” (生成序列)| 按概率分布去做排布 模仿小四的作品(生成文本序列) 机器翻译 Image to text/ 看图
阅读全文
摘要:神经网络与卷积神经网络 卷积神经网络会很频繁的用在计算机视觉中,同样也会应用到自然语言处理中的情感分析等; 从神经网络到卷积神经网络 DNN能用到计算机视觉上吗?为什么需要CNN? 卷积神经网络和人工神经网络的差异在哪? ① 图像三维矩阵,跟输入的维度没有关系,采集到的数据单个样本的维度很高,256
阅读全文
摘要:输入input,特征提取(feature representation (hand-crafted)),学习算法(learn algorithm,eg.. SVM) 线性分类器 线性分类器比如逻辑回归、线性SVM,我们会拿到一个决策边界(直线、平面等); 监督学习很重要的两点:假设函数(从x怎么得到
阅读全文
摘要:1. 常见的聊天机器人种类及技术架构 聊天机器人的种类 聊天机器人的分类 对于聊天机器人,通常有两种类型:一种是闲聊型的,另外一种是任务导向型的。从上述图中可以看出,第一个聊天机器人显然没有什么任何目的性,不是为了完成某一个任务而设计的。相反,第二个聊 天机器人是为了完成某特定的任务而设计的。在本章
阅读全文
摘要:支持向量机的核心思想 支持向量机在机器学习领域中扮演着举足轻重的角色,应该算是前深度学习时代最重要的产物。即便现在,对于很多分类问题我们也倾向于使用支持向量机如文本分类、疾病分类等等。之所以支持向量 机受到如此的关注,主要原因归类为以下几点: 从模型的效果来说确实比较优秀,甚至很多时候可以媲美比它更
阅读全文
摘要:1. Pytorch介绍 常见深度学习框架 近几年深度学习崛起,它的崛起背后最大的功臣-深度学习框架。如果没有这些深度学习框架,深度学习绝对不会像现在一样“平民化”,很多人可能陷入在茫茫的数学深渊中。有了可方便使用的深度学习 框架,我们可以把所有精力花在如何设计模型本身上,而不用再去关注模型优化的细
阅读全文
摘要:提升树 1. 提升树的核心思想 Bagging与Boosting的区别 集成模型--随机森林,且也了解到随机森林属于Bagging的成员。另外一种集成模型叫作Boosting。什么叫Bagging? 比如在随机森林里,针对于样本数据,我们同时训练了多棵决策树,然后让这些决策树 通过投票的方式来参与预
阅读全文
摘要:1. 神经网络 神经网络与深度学习 在过去的10年,AI不仅在学术界同时也在工业界取得了飞速的发展,背后离不开深度学习的贡献。就是因为深度学习的崛起,人工智能逐步进入了人们的视野,也有了今天各种AI的落地场景。特别是, ImageNet竞赛和AlphaGo事件正好也起到了催化剂的作用,迅速引起了全球
阅读全文
摘要:决策树的应用 决策树 决策树与 if-then 规则 决策树可以看作一个 if-then 规则的集合 由决策树的根节点到叶节点的每一条路径,构建一条规则:路径上内部节点的特征对应着规则的条件(condition),叶节点对应规则的结论 决策树的 if-then 规则集合有一个重要性质:互斥并且完备。
阅读全文
摘要:随机森林 1. 集成模型和它的优势 什么是集成模型 对于几乎所有的分类问题(图像识别除外,因为对于图像识别问题,目前深度学习是标配),集成模型很多时候是我们的首选。比如构建一个评分卡系统,业界的标配是GBDT或者XGBoost等集成模型,主 要因为它的效果确实好,而且稳定。还有一点是这些模型的可解释
阅读全文
摘要:K-Means 最常用的机器学习聚类算法,且为典型的基于距离的聚类算法 K均值: 基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇 以欧式距离作为相似度测度 K均值算法需要输入待聚类的数据和欲聚类的簇数k,主要的聚类过程有3步: 随机生成k个初始点作为质心; 将数据集中的数据按照距离质心
阅读全文
摘要:主成分分析-PCA 聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术 >> 将观测对象的群体按照相似性和相异性进行不同群组的划分,划分后每个群组内部各对象相似度很高,而不同群组之间的对象彼此相异度很高。 Principal Compon
阅读全文
摘要:情感分析系统 情感分析任务 情感分析是一个经典的文本分析任务,在工业界有着非常广泛的应用。从任务的角度来讲,它的输入为一段文本,输出为某一个特定的情感分类如正面、负面或者中性。 任务本身属于文本分类任务,所 以需要使用分类算法。 情感分析的一个经典的应用场景为舆情监控。比如一个公司推出了一款产品,然
阅读全文
摘要:朴素贝叶斯模型 1. 理解朴素贝叶斯 贝叶斯公式是一种基于条件概率的分类算法,如果我们已经知道 A 和 B 的发生概率,并且知道了 B 发生情况下 A 发生的概率,可以用贝叶斯公式计算 A 发生的情况下 B 发生的概率。事实上,我们可以 根据 A 的情况,即输入数据,判断 B 的概率,即 B 的可能
阅读全文

浙公网安备 33010602011771号