上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 49 下一页
摘要: 荒芜期 本人做公司产品数据分析有些时间了,在此做些总结与拓新,老生常谈数据分析到底干什么呢?笼统的说,不同岗位关心不同的数据,如同盲人摸象,带有一些模糊的色彩。其实我一个人在整这方面的东西,会权衡很多东西,不可能跟别的公司的数据团队,平铺很多东西。以目前的情况来说,面向市场挖掘信息,帮助市场,反哺产 阅读全文
posted @ 2018-09-17 16:35 Dlimeng 阅读(8) 评论(0) 推荐(0)
摘要: 从编程语言层面 BIO | NIO | AIO 以Java的角度,理解如下: BIO,同步阻塞式IO,简单理解:一个线程处理一个连接,发起和处理IO请求都是同步的。 NIO,同步非阻塞IO, 简单理解:一个线程处理多个连接,发起IO请求是非阻塞的但处理IO请求是同步的 AIO,异步非阻塞IO,简单理 阅读全文
posted @ 2018-09-17 11:15 Dlimeng 阅读(10) 评论(0) 推荐(0)
摘要: 简介 贝叶斯分类算法是一大类分类算法的总称 贝叶斯分类算法以样本可能属于某类的概率来作为分类依据 朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种 注:朴素的意思是条件概率独立性 此处要想真正理解,需要有概率论的基础知识 P(A|x1x2x3x4)=p(A|x1)*p(A|x2)p(A|x3)p(A 阅读全文
posted @ 2018-09-09 18:38 Dlimeng 阅读(15) 评论(0) 推荐(0)
摘要: 简介 K-means算法是集简单和经典于一身的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为类簇是由距离靠近的对象组成的,因为把得到紧凑且独立的簇作为最终目标。 算法 核心思想 通过迭代寻找k个类簇的一种划分方案,使得用这k个类簇的均值来代表相 阅读全文
posted @ 2018-09-09 18:27 Dlimeng 阅读(52) 评论(0) 推荐(0)
摘要: 预处理 现实世界数据源极易受噪声、缺失值和不一致数据的侵扰。低质量的数据将导致低质量的挖掘结果。 属性是一个数据字段,表示数据对象的一个特征。 标称属性:一些符号或者事物的名称,比如:职业,学历 二元属性:一种标称属性,只有两个类别或者状态:0或1,其中0表示不出现,1表示出现。对称,比如:男女,没 阅读全文
posted @ 2018-09-04 14:51 Dlimeng 阅读(38) 评论(0) 推荐(0)
摘要: 承接url:https://limeng.blog.csdn.net/article/details/82803797 阅读全文
posted @ 2018-08-19 14:22 Dlimeng 阅读(12) 评论(0) 推荐(0)
摘要: url:机器学习系列--KNN分类算法 用的是spark2.0.2,scala2.11 import org.apache.spark.{SparkConf, SparkContext} object knntest { /** * 欧式距离 * 计算两点间的距离 * @param rs as r1 阅读全文
posted @ 2018-08-10 20:32 Dlimeng 阅读(15) 评论(0) 推荐(0)
摘要: 一.机器学习简介 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论,统计学,逼近论,凸分析、算法复杂度理论等多门学科。专门研究计算机怎么模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具 阅读全文
posted @ 2018-08-10 20:27 Dlimeng 阅读(27) 评论(0) 推荐(0)
摘要: 承接:https://limeng.blog.csdn.net/article/details/82803793 阅读全文
posted @ 2018-08-04 15:58 Dlimeng 阅读(9) 评论(0) 推荐(0)
摘要: 承接: 数据基础02 阅读全文
posted @ 2018-08-04 15:58 Dlimeng 阅读(7) 评论(0) 推荐(0)
上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 49 下一页