NeilZhang

2019年1月2日

摘要：策略模式基础讲解已经很详尽： https://www.cnblogs.com/lewis0077/p/5133812.html 补充使用实例1：网络请求重试策略策略接口: 抽象类默认重试策略的实现: 业务请求实体中会包含一个 RetryPolicy 对象，当需要判断是否需要重试时只需要调用该对象阅读全文

posted @ 2019-01-02 14:30 NeilZhang 阅读(341) 评论(0) 推荐(0)

2018年12月9日

Kaggle-tiantic数据建模与分析

摘要： 1.数据可视化 kaggle中数据解释：https://www.kaggle.com/c/titanic/data 数据形式：读取数据，并显示数据信息数据结果如下：数据解释： 1.1 生存/死亡人数统计 1.2 PClass 通过数据分布可以很明显的看出 Pclass 为 1/2 的乘客存活率阅读全文

posted @ 2018-12-09 19:44 NeilZhang 阅读(1371) 评论(0) 推荐(0)

数据预处理—独热编码

摘要：问题引入在很多机器学习任务中，特征并不总是连续值，而有可能是分类值。例如，考虑一下的三个特征：如果将上述特征用数字表示，效率会高很多。例如：但是，即使转化为数字表示后，上述数据也不能直接用在我们的分类器中。这个的整数特征表示并不能在分类器中直接使用，因为这样的连续输入，估计器会认为类别之间是阅读全文

posted @ 2018-12-09 11:59 NeilZhang 阅读(2845) 评论(0) 推荐(0)

2018年12月2日

推荐系统-协同过滤

摘要：一、基本介绍 1. 推荐系统任务推荐系统的任务就是联系用户和信息一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它感兴趣的用户面前从而实现信息消费者和信息生产者的双赢。 2. 与搜索引擎比较相同点：帮助用户快速发现有用信息的工具不同点：和搜索引擎不同的是推荐系统不需要用户提供明确的需求而是通过分析用户的历史行为来给用户的兴趣建模从而主动给用户推荐出能够满足他们兴趣和需... 阅读全文

posted @ 2018-12-02 13:36 NeilZhang 阅读(1081) 评论(0) 推荐(0)

2018年11月10日

推荐系统实战-冷启动问题

摘要：一、冷启动问题介绍如何在没有大量用户数据的情况下设计个性化推荐系统并让用户对推荐结果满意从而愿意使用推荐系统，就是冷启动问题。用户冷启动：如何给新用户做个性化推荐物品冷启动：如何将新物品推荐给可能对其感兴趣的用户。在新闻网站等时效性很强的网站中非常重要。系统冷启动：如何在一个新开发的网站上设阅读全文

posted @ 2018-11-10 10:05 NeilZhang 阅读(2208) 评论(0) 推荐(0)

2018年11月3日

推荐系统-协同过滤原理与实现

摘要：一、基本介绍 1. 推荐系统任务推荐系统的任务就是联系用户和信息一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它感兴趣的用户面前从而实现信息消费者和信息生产者的双赢。 2. 与搜索引擎比较相同点：帮助用户快速发现有用信息的工具不同点：和搜索引擎不同的是推荐系统不需要用户提供阅读全文

posted @ 2018-11-03 14:21 NeilZhang 阅读(48979) 评论(6) 推荐(5)

2018年10月28日

Hadoop生态系统之Yarn

摘要： Apache YARN（Yet Another Resource Negotiator）是Hadoop的集群资源管理系统。YARN被引入Hadoop2最初是为了改善MapReduce的实现，但它具有足够的通性，同样可以支持其他的分布式计算模式。 YARN在Hadoop2.0中与其它组件关系： Ya 阅读全文

posted @ 2018-10-28 10:59 NeilZhang 阅读(756) 评论(0) 推荐(0)

2018年10月27日

Hadoop生态系统之HDFS

摘要：一、介绍 HDFS ：分布式文件系统（distributed filesystem），主从结构。以流式数据访问模式来存储超大文件，运行于商用硬件集群上。超大文件：几百M，几百G，甚至几百TB大小的文件。流式数据访问：一次写入，多次读取。每次读取都涉及到数据集的大部分数据甚至是全部，因此阅读全文

posted @ 2018-10-27 15:26 NeilZhang 阅读(665) 评论(0) 推荐(0)

2018年10月26日

Hadoop环境搭建及wordcount程序

摘要：目的：前期学习了一些机器学习基本算法，实际企业应用中算法是核心，运行的环境和数据处理的平台是基础。手段：搭建简易hadoop集群（由于机器限制在自己的笔记本上通过虚拟机搭建）一、基础环境介绍 win10 vmware15.0.0 3 ubuntu 虚拟机（1 台作为master ，另外2台作阅读全文

posted @ 2018-10-26 20:32 NeilZhang 阅读(1303) 评论(0) 推荐(0)

2018年9月9日

Java内存分配及垃圾回收算法（hotspot虚拟机）

摘要：一、运行时内存分配Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途，以及创建和销毁的时间，有的区域随着虚拟机进程的启动而存在，有些区域则依赖用户线程的启动和结束而建立和销毁。线程私有区域（生命周期与线程相同）a) 虚拟机栈虚拟机栈描述的是Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧（Stack Fram... 阅读全文

posted @ 2018-09-09 16:03 NeilZhang 阅读(1133) 评论(0) 推荐(1)

Fear can hold you prisoner. Hope can set you free.

公告