随笔分类 -  机器学习

摘要:【一】整体流程综述 gensim底层封装了Google的Word2Vec的c接口,借此实现了word2vec。使用gensim接口非常方便,整体流程如下: 1. 数据预处理(分词后的数据) 2. 数据读取 3.模型定义与训练 4.模型保存与加载 5.模型使用(相似度计算,词向量获取) 【二】gens 阅读全文
posted @ 2019-07-02 16:41 Sgoyi 阅读(415) 评论(0) 推荐(0)
摘要:梯度下降(最速下降法) 梯度下降法是一个最优化算法,通常也称为最速下降法。最速下降法是求解无约束优化问题最简单和最古老的方法之一,虽然现在已经不具有实用性,但是许多有效算法都是以它为基础进行改进和修正而得到的。最速下降法是用负梯度方向为搜索方向的,最速下降法越接近目标值,步长越小,前进越慢。可以用于 阅读全文
posted @ 2018-06-28 14:06 Sgoyi 阅读(5727) 评论(0) 推荐(1)
摘要:监督学习(Supervised learning) 无监督学习(Unsupervised learning)、 半监督学习(Semi-supervised learning), 分类 聚类 回归 监督学习 1、监督式学习(Supervised learning),是一个机器学习中的方法,可以由训练资 阅读全文
posted @ 2018-06-28 13:49 Sgoyi 阅读(5209) 评论(0) 推荐(0)
摘要:Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库 Pandas的两大核心数据结构 Series(一维数据) DataFrame(多特征数据,既有行索引,又有列索引) 一、生成数据表 1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用: 2、导入CSV或 阅读全文
posted @ 2018-06-21 18:31 Sgoyi 阅读(410) 评论(0) 推荐(0)
摘要:Numpy基础 NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy内部解除了Python的PIL(全局解释器锁),运算效率极好,是大量机器学习框架的基础库! Numpy简单创建数组 Numpy查看数组属性 快速创建N维数 阅读全文
posted @ 2018-06-20 15:21 Sgoyi 阅读(1023) 评论(0) 推荐(1)