赞助

随笔分类 -  机器学习

摘要:概述 命名实体识别在NLP的应用中也是非常广泛的,尤其是是information extraction的领域。Named Entity Recognition(NER) 的应用中,最常用的一种算法模型是隐式马可夫模型(Hidden Markov Modelling)- HMM。本节内容主要是通过介绍 阅读全文
posted @ 2020-03-28 00:19 HappyPuppy 阅读(1049) 评论(0) 推荐(0)
摘要:概述 Attention Model 的出现,在sequence model的领域中算是一个跨时代的事件。在Many-to-Many的sequence model中,在decoder network中的每一个time step的输出应该跟encoder network中的不同的time step的值 阅读全文
posted @ 2020-03-22 22:43 HappyPuppy 阅读(926) 评论(0) 推荐(0)
摘要:1. 概述 在情感分析的应用领域,例如判断某一句话是positive或者是negative的案例中,咱们可以通过传统的standard neuro network来作为解决方案,但是传统的神经网络在应用的时候是不能获取前后文字之间的关系的,不能获取到整个句子的一个整体的意思,只能通过每一个词的意思来 阅读全文
posted @ 2020-03-19 12:10 HappyPuppy 阅读(1962) 评论(0) 推荐(0)
摘要:概述 LSTM在机器学习上面的应用是非常广泛的,从股票分析,机器翻译 到 语义分析等等各个方面都有它的用武之地,经过前面的对于LSTM结构的分析,这一节主要介绍一些LSTM的一个小应用,那就是sequence generation。其实sequence generation本事也是对一些应用的统称, 阅读全文
posted @ 2020-03-10 22:47 HappyPuppy 阅读(1146) 评论(0) 推荐(0)
摘要:概述 RNN是递归神经网络,它提供了一种解决深度学习的另一个思路,那就是每一步的输出不仅仅跟当前这一步的输入有关,而且还跟前面和后面的输入输出有关,尤其是在一些NLP的应用中,经常会用到,例如在NLP中,每一个输出的Word,都跟整个句子的内容都有关系,而不仅仅跟某一个词有关。LSTM是RNN的一种 阅读全文
posted @ 2020-03-02 20:52 HappyPuppy 阅读(933) 评论(0) 推荐(0)
摘要:概述 自然语言是非常复杂多变的,计算机也不认识咱们的语言,那么咱们如何让咱们的计算机学习咱们的语言呢?首先肯定得对咱们的所有文字进行编码吧,那咱们很多小伙伴肯定立马就想出了这还不简单嘛,咱们的计算机不都是ASCII编码的嘛,咱直接拿来用不就好啦?我只能说too young too simple。咱们 阅读全文
posted @ 2020-02-09 19:42 HappyPuppy 阅读(5907) 评论(2) 推荐(3)
摘要:概述 对于计算机视觉的应用现在是非常广泛的,但是它背后的原理其实非常简单,就是将每一个像素的值pixel输入到一个DNN中,然后让这个神经网络去学习这个模型,最后去应用这个模型就可以了。听起来是不是很简单,其实如果大家深入研究的话,这里面还是有很多内容去学习的,例如:咱们的图片大小可能不一样,同一张 阅读全文
posted @ 2020-02-05 23:30 HappyPuppy 阅读(1213) 评论(0) 推荐(0)
摘要:概述 神经网络是深度学习的基础,它在人工智能中有着非常广泛的应用,它既可以应用于咱们前面的章节所说的Linear Regression, classification等问题,它还广泛的应用于image recognition,NLP 等等应用中,当然啦,这一节咱们主要讲述神经网络的最基础的结构以及应 阅读全文
posted @ 2020-02-03 19:55 HappyPuppy 阅读(1304) 评论(0) 推荐(0)
摘要:概述 前面几节讲的是linear regression的内容,这里咱们再讲一个非常常用的一种模型那就是classification,classification顾名思义就是分类的意思,在实际的情况是非常常用的,例如咱们可以定义房价是否过高,如果房价高于100万,则房价过高,设置成true;如果房价低 阅读全文
posted @ 2020-02-01 22:45 HappyPuppy 阅读(1557) 评论(1) 推荐(0)
摘要:概述 这一节主要介绍一下TensorFlow在应用的过程中的几个小的知识点,第一个是关于features的处理的,例如Bucketized (Binned) Features 和 Feature scalling。第二个是简单的介绍一下常用的几个Optimizer之间的区别,例如SGD, Adagr 阅读全文
posted @ 2020-01-30 23:26 HappyPuppy 阅读(864) 评论(0) 推荐(0)
摘要:TensorFlow是咱们机器学习领域非常常用的一个组件,它在数据处理,模型建立,模型验证等等关于机器学习方面的领域都有很好的表现,前面的一节我已经简单介绍了一下TensorFlow里面基础的数据结构即:Tensor和Dataset; 这里咱们开始介绍TensorFlow的建模过程以及验证模型的一些 阅读全文
posted @ 2020-01-29 20:13 HappyPuppy 阅读(1343) 评论(4) 推荐(0)
摘要:好了,咱们今天终于进入了现阶段机器学习领域内最流行的一个框架啦——TensorFlow。对的,这款由谷歌开发的机器学习框架非常的简单易用并且得到了几乎所有主流的认可,谷歌为了推广它的这个框架甚至单独开辟了免费学习这个框架的视频教程,可惜这些教程都是基于TensorFlow1.0版本的,一直没有更新。 阅读全文
posted @ 2020-01-28 17:14 HappyPuppy 阅读(1967) 评论(0) 推荐(1)
摘要:前面一节咱们已经介绍了决策树的原理已经在sklearn中的应用。那么这里还有两个数据处理和sklearn应用中的小知识点咱们还没有讲,但是在实践中却会经常要用到的,那就是交叉验证cross_validation和Pipeline。cross_validation是保证了咱们的模型不受数据分布的影响, 阅读全文
posted @ 2020-01-26 20:31 HappyPuppy 阅读(3541) 评论(0) 推荐(1)
摘要:咱们正式进入了机器学习的模型的部分,虽然现在最火的的机器学习方面的库是Tensorflow, 但是这里还是先简单介绍一下另一个数据处理方面很火的库叫做sklearn。其实咱们在前面已经介绍了一点点sklearn,主要是在categorical data encoding那一块。其实sklearn在数 阅读全文
posted @ 2020-01-22 00:43 HappyPuppy 阅读(786) 评论(0) 推荐(0)
摘要:概述:上节咱们说了特征工程是机器学习的一个核心内容。然后咱们已经学习了特征工程中的基础内容,分别是missing value handling和categorical data encoding的一些方法技巧。但是光会前面的一些内容,还不足以应付实际的工作中的很多情况,例如如果咱们的原始数据的fea 阅读全文
posted @ 2020-01-19 12:09 HappyPuppy 阅读(2152) 评论(1) 推荐(0)
摘要:好了,大家现在进入到机器学习中的一块核心部分了,那就是特征工程,洋文叫做Feature Engineering。实际在机器学习的应用中,真正用于算法的结构分析和部署的工作只占很少的一部分,相反,用于特征工程的时间基本都占70%以上,因为是实际的工作中,绝大部分的数据都是非标数据。因而这一块的内容是非 阅读全文
posted @ 2020-01-17 18:51 HappyPuppy 阅读(1812) 评论(0) 推荐(0)
摘要:现在每天产生的数据都是海量的,这些数据中既有高质量的也有很多垃圾,如何从这些海量的数据中洞察出这些数据的内在联系是我们机器学习的核心内容。如果光把数据丢在大家的面前,咱们肯定是无感的,无法获取这些数据的意义。为了能够更加直观的了解这些数据的一些特征,例如数据的分布情况,数据的趋势和走势,数据之间的对 阅读全文
posted @ 2020-01-15 20:31 HappyPuppy 阅读(2607) 评论(0) 推荐(0)
摘要:Pandas是一款适用很广的数据处理的组件,如果将来从事机械学习或者数据分析方面的工作,咱们估计70%的时间都是在跟这个框架打交道。那大家可能就有疑问了,心想这个破玩意儿值得花70%的时间吗?咱不是还有很牛逼的Tensorflow, keras,神经网络,classification等等这些牛逼的技 阅读全文
posted @ 2020-01-04 21:10 HappyPuppy 阅读(3554) 评论(0) 推荐(2)
摘要:Numpy是专门为数据科学或者数据处理相关的需求设计的一个高效的组件。听起来是不是挺绕口的,其实简单来说就2个方面,一是Numpy是专门处理数据的,二是Numpy在处理数据方面很牛逼(肯定比Python原生组件牛逼,否则也不会另外再来搞个Numpy了吧)。其实更加细化的来看其实Numpy最常用的就是 阅读全文
posted @ 2019-12-30 22:00 HappyPuppy 阅读(1503) 评论(0) 推荐(0)
摘要:好了,咱们接着上一节的内容,继续学习机器学习中的Python语法部分。这一节算是Python语法的最后一节了。也就是说如果真的看懂了这两节的内容,理论上说就机器学习的领域或者方向,语言已经不是问题了。同时也意味着马上真正的进入机器学习的核心部分了。好了,那咱们接下来正式开始咱们的学习啦。 Tuple 阅读全文
posted @ 2019-12-28 22:07 HappyPuppy 阅读(620) 评论(2) 推荐(1)