上一页 1 2 3 4 5 6 7 8 9 10 ··· 15 下一页
摘要: 聚类概念 在无监督学习中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质和规律。此类学习任务中研究最多的是聚类。 聚类视图将数据中的样本分为若干个不相交的子集,每个子集称为一个簇。每个簇有各自的性质。 聚类既能作为一个单独过程,用于寻找数据内在的分布结构,也可以作为 阅读全文
posted @ 2020-04-24 19:52 Tanglement 阅读(185) 评论(0) 推荐(0)
摘要: 找到一篇很好的SVM学习笔记[https://blog.csdn.net/Revendell/article/details/84674024],良心推荐。 在样本空间中,划分超平面可通过线性方程来描述: 其中w是法向量决定了超平面的方向,b为位移项,决定超平面与原点之间的距离。 支持向量 距离超平 阅读全文
posted @ 2020-04-23 10:52 Tanglement 阅读(252) 评论(0) 推荐(0)
摘要: 引自[https://www.cnblogs.com/czdbest/p/5771500.html] 对p(x|y)建模。根据大象的特征学习出一个大象模型,根据狗的特征学习出狗的模型,对于新的样本,将特征分别放到两个模型,哪个概率大,就确定是哪种动物。 p(x|y)建模后,用贝叶斯定理,可以算出p( 阅读全文
posted @ 2020-04-22 16:14 Tanglement 阅读(125) 评论(0) 推荐(0)
摘要: 只是学习笔记,杂乱。 在[https://blog.csdn.net/Cdd2xd/article/details/75635688]有更好的归纳和解释。 基本形式 线性模型,具有更好的可解释性,每个参数有表示的意义。 线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记。 要训练w使得代价函 阅读全文
posted @ 2020-04-21 23:12 Tanglement 阅读(482) 评论(0) 推荐(0)
摘要: HBaseDao 初始化函数,init()创建命名空间和表 插入数据函数,rowkey和数据 明显看出封装数据对象后,代码简洁。 BaseDao HBaseDao的具体实现方法。 start(),建立连接和获取Admin end(),关闭连接和admin createTableXX(),创建表,输入 阅读全文
posted @ 2020-04-20 11:03 Tanglement 阅读(332) 评论(0) 推荐(0)
摘要: 流程 kafka配置 创建消费者 关注主题ct 获取数据 将数据写入HBase consumer.properties是kafka集群的配置信息,calllog是数据封装对象。 写入HBase具体代码 https://www.cnblogs.com/chenshaowei/p/12736522.ht 阅读全文
posted @ 2020-04-20 10:55 Tanglement 阅读(382) 评论(0) 推荐(0)
摘要: 准备工作 需要先安装好Zookeeper集群和Hadoop集群 Zookeeper集群启动 ./bin/zkServer.sh start ./bin/zkServer.sh start ./bin/zkServer.sh start Hadoop集群启动 ./sbin/start-dfs.sh . 阅读全文
posted @ 2020-04-16 19:07 Tanglement 阅读(482) 评论(0) 推荐(0)
摘要: 采集文件call.log的数据到kafka,并从kafka消费者控制台获取数据。 flume+kafka是目前大数据很经典的日志采集工具。文件数据通过flume采集,通过kafka进行订阅发布并缓存,很适合充当消息中间件。 准备工作 启动zookeeper,kafka集群 在kafka创建ct主题, 阅读全文
posted @ 2020-04-12 14:40 Tanglement 阅读(3528) 评论(0) 推荐(0)
摘要: 给定一个链表,删除链表的倒数第n个节点,并且返回链表的头结点。 两次循环 思路:第一次循环找出链表的总长度,第二次循环将倒数第n个节点删除。 在链表头结点前加一个空节点,可以简化操作,对于删除头结点的情况不用特殊处理。 一次循环 思路:一次循环就要在循环中确定倒数n个节点的位置。设置两个指针p,q, 阅读全文
posted @ 2020-04-08 12:34 Tanglement 阅读(126) 评论(0) 推荐(0)
摘要: kafka安装前提 需要安装对应版本的scala,jdk,zookeeper 安装步骤 解压 改名+增加权限 建立日志存放路径 更改配置文件server.properties 配置环境变量 将/kafka目录分发给其他节点hadoop2,hadoop3 需要在各自的配置文件server.proper 阅读全文
posted @ 2020-04-07 20:51 Tanglement 阅读(232) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 15 下一页