2018年5月23日

Java面试题5

摘要: Volatile的特征: A、禁止指令重排(有例外) B、可见性 Volatile的内存语义: 当写一个volatile变量时,JMM会把线程对应的本地内存中的共享变量值刷新到主内存。 当读一个volatile变量时,JMM会把线程对应的本地内存置为无效,线程接下来将从主内存中读取共享变量。 Vol 阅读全文

posted @ 2018-05-23 18:45 布衣小工 阅读(227) 评论(0) 推荐(0)

Java 面试题

摘要: 基础题目 技术深度 技术框架 系统架构 分布式系统 实战能力 软能力 阅读全文

posted @ 2018-05-23 18:43 布衣小工 阅读(416) 评论(0) 推荐(0)

聚类算法之K-Means

摘要: K-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-means算法需要事先指定簇的个数k,算法开始随机选择k个记录点作为中心点,然后遍历整个数据集的各条记录,将每条记录归到离它最 阅读全文

posted @ 2018-05-23 16:27 布衣小工 阅读(1160) 评论(0) 推荐(0)

分类算法之朴素贝叶斯

摘要: 一个简单的例子 朴素贝叶斯算法是一个典型的统计学习方法,主要理论基础就是一个贝叶斯公式,贝叶斯公式的基本定义如下: 这个公式虽然看上去简单,但它却能总结历史,预知未来。公式的右边是总结历史,公式的左边是预知未来,如果把Y看出类别,X看出特征,P(Yk|X)就是在已知特征X的情况下求Yk类别的概率,而 阅读全文

posted @ 2018-05-23 16:25 布衣小工 阅读(338) 评论(0) 推荐(0)

分类算法评价标准

摘要: 一、引言 分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择分类,如何评价一个分类算法的好坏,前面关于决策树的介绍,我们主要用的正确率(accuracy)来评价分类算法。 正确率确实是一个很好很 阅读全文

posted @ 2018-05-23 16:22 布衣小工 阅读(779) 评论(0) 推荐(0)

分类算法之决策树

摘要: 分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。 一、分类基本介绍 物以类聚,人以群分,分类问题只古以来就出现我们的生活中。分类是数据挖掘中一个重要的分支,在各方面都有着广泛的应用,如医学疾病判别、垃圾邮件过滤、垃圾 阅读全文

posted @ 2018-05-23 16:19 布衣小工 阅读(421) 评论(0) 推荐(0)

关联规则评价标准

摘要: 前面我们讨论的关联规则都是用支持度和自信度来评价的,如果一个规则的自信度高,我们就说它是一条强规则,但是自信度和支持度有时候并不能度量规则的实际意义和业务关注的兴趣点。 一个误导我们的强规则 看这样一个例子,我们分析一个购物篮数据中购买游戏光碟和购买影片光碟之间的关联关系。交易数据集共有10,000 阅读全文

posted @ 2018-05-23 16:14 布衣小工 阅读(1278) 评论(0) 推荐(0)

关联规则之FpGrowth算法

摘要: Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多。 FpGrowth算法通过构 阅读全文

posted @ 2018-05-23 16:11 布衣小工 阅读(15240) 评论(0) 推荐(1)

关联规则之Aprior算法

摘要: 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。 啤酒与尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书《啤酒与尿布》,虽然说这个故事是哈弗商学院杜撰出来的,但确实能很好的解释关联规则挖掘的原理。我们这里以一个超市购物篮迷 阅读全文

posted @ 2018-05-23 16:06 布衣小工 阅读(2838) 评论(0) 推荐(0)

分类算法之KNN分类

摘要: 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最近的实例投票决定新实例的类标。KNN是一种基于实例的学习算法,它不同于贝叶斯、决策树等算法,KNN不需要训练,当有新的实例出现时,直接在训练数据集中找k个最近的实例,把这个新的实例分配给这k个训练实例中实例数最多 阅读全文

posted @ 2018-05-23 15:56 布衣小工 阅读(6093) 评论(0) 推荐(0)

数据分析思考

摘要: 实际上相当多同学顶着“数据分析师”的头衔,干的却是数据分析专员的活。专员=砖员,基本上每天都在辛苦的搬砖,不是搬SQL就是搬EXCEL。虽然看起来也是在处理数据,然而跟“分析”没有一毛钱关系,也没有升职机会。想要去面试,又没有真正做过一个数据分析项目,建模不懂,业务不明,甚是辛苦。 对于这些从事基层 阅读全文

posted @ 2018-05-23 10:54 布衣小工 阅读(216) 评论(0) 推荐(0)

导航