摘要: 在调试Kerberos的时候可能会有需要禁用的场景。以下是各组件禁用Kerberos的相关配置。 环境 CDH版本:5.11.2 Linux版本:7.4.1708 Docker版本:Docker version 18.06.0 ce JDK版本:1.8 Zookeeper : false 的Serv阅读全文
posted @ 2018-09-17 13:52 mantou叔叔 阅读(6) 评论(0) 编辑
摘要: 本文首先会简单介绍Kylin的安装配置,然后介绍启用Kerberos的CDH集群中如何部署及使用Kylin。阅读全文
posted @ 2018-09-14 18:22 mantou叔叔 阅读(86) 评论(0) 编辑
摘要: 1. 概述 Kerberos是一种计算机网络认证协议,它允许某实体在非安全网络环境下通信,向另一个实体以一种安全的方式证明自己的身份。它也指由麻省理工实现此协议,并发布的一套免费软件。它的设计主要针对客户 服务器模型,并提供了一系列交互认证——用户和服务器都能验证对方的身份。Kerberos协议可以阅读全文
posted @ 2018-08-11 18:57 mantou叔叔 阅读(239) 评论(0) 编辑
摘要: 1. JWT 介绍 JSON Web Token(JWT)是一个开放式标准(RFC 7519),它定义了一种紧凑(Compact)且自包含(Self contained)的方式,用于在各方之间以JSON对象安全传输信息。 这些信息可以通过数字签名进行验证和信任。 可以使用秘密(使用HMAC算法)或使阅读全文
posted @ 2018-05-05 12:19 mantou叔叔 阅读(2864) 评论(0) 编辑
摘要: 1. 简介 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他阅读全文
posted @ 2018-04-21 11:27 mantou叔叔 阅读(189) 评论(0) 编辑
摘要: 1. 多元线性回归定义 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。 我们现在介绍方程的符号,我们可阅读全文
posted @ 2018-04-18 09:01 mantou叔叔 阅读(64) 评论(0) 编辑
摘要: 1. K 近邻算法概述(k Nearest Neighbor,KNN) K 近邻算法采用测量不同的特征值之间的距离方法进行分类。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 优点 :精度高、对异常数据不敏感、无数据阅读全文
posted @ 2018-04-11 00:20 mantou叔叔 阅读(185) 评论(0) 编辑
摘要: 1. Gradient Descent(梯度下降) 梯度下降算法是很常用的算法,可以将代价函数J最小化。它不仅被用在线性回归上,也被广泛应用于机器学习领域中的众多领域。 1.1 线性回归问题应用 我们有一个函数 ,要使其最小化 : Outline 对θ0,θ1开始进行一些猜测 通常将初θ0,θ1初始阅读全文
posted @ 2018-04-09 23:41 mantou叔叔 阅读(122) 评论(0) 编辑
摘要: 本章内容主要是介绍:单变量线性回归算法(Linear regression with one variable) 1. 线性回归算法(linear regression) 1.1 预测房屋价格 下图是俄勒冈州波特兰市的住房价格和面积大小的关系: 该问题属于监督学习中的回归问题,让我们来复习一下: 监阅读全文
posted @ 2018-03-26 23:33 mantou叔叔 阅读(316) 评论(2) 编辑
摘要: 1. Machine Learning definition(机器学习定义) Arthur Samuel(1959年)将机器学习非正式定义为:在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。 创造西洋棋程序,可以和自己对战。 Tom Mitchell(1998年)提出一个更为正式阅读全文
posted @ 2018-03-26 10:03 mantou叔叔 阅读(145) 评论(0) 编辑