2018年5月23日

关联规则之FpGrowth算法

摘要: Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多。 FpGrowth算法通过构 阅读全文

posted @ 2018-05-23 16:11 布衣小工 阅读(14978) 评论(0) 推荐(1) 编辑

关联规则之Aprior算法

摘要: 关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。 啤酒与尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书《啤酒与尿布》,虽然说这个故事是哈弗商学院杜撰出来的,但确实能很好的解释关联规则挖掘的原理。我们这里以一个超市购物篮迷 阅读全文

posted @ 2018-05-23 16:06 布衣小工 阅读(2718) 评论(0) 推荐(0) 编辑

分类算法之KNN分类

摘要: 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个最近的实例投票决定新实例的类标。KNN是一种基于实例的学习算法,它不同于贝叶斯、决策树等算法,KNN不需要训练,当有新的实例出现时,直接在训练数据集中找k个最近的实例,把这个新的实例分配给这k个训练实例中实例数最多 阅读全文

posted @ 2018-05-23 15:56 布衣小工 阅读(6021) 评论(0) 推荐(0) 编辑

数据分析思考

摘要: 实际上相当多同学顶着“数据分析师”的头衔,干的却是数据分析专员的活。专员=砖员,基本上每天都在辛苦的搬砖,不是搬SQL就是搬EXCEL。虽然看起来也是在处理数据,然而跟“分析”没有一毛钱关系,也没有升职机会。想要去面试,又没有真正做过一个数据分析项目,建模不懂,业务不明,甚是辛苦。 对于这些从事基层 阅读全文

posted @ 2018-05-23 10:54 布衣小工 阅读(203) 评论(0) 推荐(0) 编辑

2018年5月22日

Java源码之ArrayList

摘要: 本文源码均来自Java 8 总体介绍 Collection接口是集合类的根接口,Java中没有提供这个接口的直接的实现类。Set和List两个类继承于它。Set中不能包含重复的元素,也没有顺序来存放。而List是一个有序的集合,可以包含重复的元素。 而Map又是另一个接口,它和Collection接 阅读全文

posted @ 2018-05-22 18:37 布衣小工 阅读(255) 评论(0) 推荐(0) 编辑

2018年5月21日

手写一个简化版Tomcat

摘要: 摘要: 我们很多时候都想知道Web容器Tomcat是如何工作的?它是如何处理我们传入http请求的?又是如何响应的? Tomcat作为Web服务器深受市场欢迎,有必要对其进行深入的研究。在工作中,我们经常会把写好的代码打包放在Tomcat里并启动,然后在浏览器里就能愉快的调用我们写的代码来实现相应的 阅读全文

posted @ 2018-05-21 14:41 布衣小工 阅读(4937) 评论(0) 推荐(2) 编辑

MySQL的索引是什么?怎么优化?

摘要: 索引类似大学图书馆建书目索引,可以提高数据检索的效率,降低数据库的IO成本。MySQL在300万条记录左右性能开始逐渐下降,虽然官方文档说500~800w记录,所以大数据量建立索引是非常有必要的。MySQL提供了Explain,用于显示SQL执行的详细信息,可以进行索引的优化。 一、导致SQL执行慢 阅读全文

posted @ 2018-05-21 14:35 布衣小工 阅读(270) 评论(0) 推荐(0) 编辑

Java面试题4-附答案

摘要: BIO、NIO和AIO的区别 Java BIO : 同步并阻塞,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,当然可以通过线程池机制改善。 Java NIO : 同步非阻塞,服务器实现模式为一个请求一个线程, 阅读全文

posted @ 2018-05-21 14:19 布衣小工 阅读(219) 评论(0) 推荐(0) 编辑

Java面试题3-附答案

摘要: 接口有什么用 1、通过接口可以实现不相关类的相同行为,而不需要了解对象所对应的类。 2、通过接口可以指明多个类需要实现的方法。 3、通过接口可以了解对象的交互界面,而不需了解对象所对应的类。 另:Java是单继承,接口可以使其实现多继承的功能。 说说http,https协议 HTTP: 是互联网上应 阅读全文

posted @ 2018-05-21 14:17 布衣小工 阅读(230) 评论(0) 推荐(0) 编辑

Java面试题2-附答案

摘要: JVM的内存结构 根据 JVM 规范,JVM 内存共分为虚拟机栈、堆、方法区、程序计数器、本地方法栈五个部分。 1、Java虚拟机栈: 线程私有;每个方法在执行的时候会创建一个栈帧,存储了局部变量表,操作数栈,动态连接,方法返回地址等;每个方法从调用到执行完毕,对应一个栈帧在虚拟机栈中的入栈和出栈。 阅读全文

posted @ 2018-05-21 14:15 布衣小工 阅读(155) 评论(0) 推荐(0) 编辑

导航