摘要:1.1 逻辑回归原理详解 1.1.1 LR原理讲解+公式推导 从公式推导中详细讲解逻辑回归算法的原理。 线性回归模型: 逻辑回归是用来估计一个实例属于某个特定类别的概率,是一个二分类算法,如果预估概率大于等于50%,则模型预测该实例为正类,反之,则预测为负类。 则需要把y从负无穷大到正无穷大映射为概 阅读全文
posted @ 2019-08-09 14:20 cymx66688 阅读 (37) 评论 (0) 编辑
摘要:1. 自然语言概念 自然语言,即我们人类日常所使用的语言,是人类交际的重要方式,也是人类区别其他动物的本质特征。 但是我们只能通过自然语言与人交流,无法与计算机进行交流。 2. 自然语言处理 自然语言处理,是人工智能的一部分,实现了人与计算机之间的有效通信。自然语言处理属于计算机科学领域与人工智能领 阅读全文
posted @ 2019-04-28 21:01 cymx66688 阅读 (178) 评论 (0) 编辑
摘要:牛顿法,全称Newton's method。 当N=1时, 牛顿法的基本思想是:在现有极小点估计值的附近对f(x)做二阶泰勒展开,进而找到极小点的下一个估计值。设 为当前的极小值点的估计值,那么通过二阶泰勒: 由于求的是最值, 应满足 即 求得 令,则 当N>1时,超过二维。二阶泰勒展开式可以做推广 阅读全文
posted @ 2019-09-12 18:34 cymx66688 阅读 (3) 评论 (0) 编辑
摘要:1.算法 2.大数据 阅读全文
posted @ 2019-09-06 10:11 cymx66688 阅读 (3) 评论 (0) 编辑
摘要:1.1 梯度下降 梯度下降,全称Grandient Descent,简称GD。 梯度下降是一种非常通用的优化算法,能够为大范围的问题找到最优解。梯度下降的中心思想就是迭代地调整参数,从而使成本函数最小化。 首先,初始化一个随机的θ值(可设θ=0),然后逐步改进,每次踏出一步,就尝试降低一点成本函数, 阅读全文
posted @ 2019-08-24 17:58 cymx66688 阅读 (15) 评论 (0) 编辑
摘要:1.1 scikit-learn参数介绍 1.1.1 导入 from sklearn.linear_model import LogisticRegression 1.1.2 版本 scikit-learn==0.21.3 1.1.3 参数 1.1.3.1 penalty l1、l2、elastic 阅读全文
posted @ 2019-08-16 12:34 cymx66688 阅读 (25) 评论 (0) 编辑
摘要:1.1 逻辑回归原理详解 1.1.1 LR原理讲解+公式推导 从公式推导中详细讲解逻辑回归算法的原理。 线性回归模型: 逻辑回归是用来估计一个实例属于某个特定类别的概率,是一个二分类算法,如果预估概率大于等于50%,则模型预测该实例为正类,反之,则预测为负类。 则需要把y从负无穷大到正无穷大映射为概 阅读全文
posted @ 2019-08-09 14:20 cymx66688 阅读 (37) 评论 (0) 编辑
摘要:1.结尾逗号 结尾的逗号通常是可选的,除了在构成一个元素的元组时是强制性需要的(在Python 2 中,它们对 print 语句有语义)。为了清晰起见,建议将后者用括号括起来(在技术上是多余的)。 Yes:FILES = ('setup.cfg',)下面的容易混淆:FILES = 'setup.cf 阅读全文
posted @ 2019-08-02 19:41 cymx66688 阅读 (16) 评论 (0) 编辑
摘要:包含主要 Python 发行版中的标准库的 Python 代码的编码约定。 1.代码缩进 (1)每个缩进需要使用 4 个空格。一般使用一个Tab键。 Python 3 不允许混合使用制表符和空格来缩进。python 2 使用 tabs 和空格的组合缩进方式应该转换为专门使用空格缩进。 延续行应该使用 阅读全文
posted @ 2019-07-28 15:03 cymx66688 阅读 (14) 评论 (0) 编辑
摘要:在word2vec原理中讲到如果每个词向量由300个元素组成,并且一个单词表中包含了10000个单词。回想神经网络中有两个权重矩阵——一个在隐藏层,一个在输出层。这两层都具有300 x 10000 = 3,000,000个权重!使用梯度下降法在这种巨大的神经网络下面进行训练是很慢的。并且可能更糟糕的 阅读全文
posted @ 2019-07-21 22:21 cymx66688 阅读 (72) 评论 (0) 编辑
摘要:1.word2vec简介 word2vec,即词向量,就是一个词用一个向量来表示。是2013年Google提出的。word2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(neg 阅读全文
posted @ 2019-07-14 21:27 cymx66688 阅读 (40) 评论 (0) 编辑
摘要:知识图谱中的知识是通过RDF结构来进行表示的,其基本单元是事实。每个事实是一个三元组(S, P, O),在实际系统中,按照存储方式的不同,知识图谱的存储可以分为基于表结构的存储和基于图结构的存储。 基于表结构的存储可以用关系型数据库,常见的关系型数据库存储系统有MySQL、Oracle、DB2、Mi 阅读全文
posted @ 2019-06-16 21:34 cymx66688 阅读 (332) 评论 (0) 编辑