上一页 1 2 3 4 5 6 7 ··· 22 下一页
摘要: 聚类介绍 K-Means:基本原理、优化目标和求解方法 GMM:给类标签引入概率解释 EM算法:一种求解隐变量概率模型的通用方法 阅读全文
posted @ 2021-01-30 21:04 大米粒o 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 一、实验目的 (1)通过实验学习日志采集工具 Flume 的安装和使用方法; (2)掌握采用 Flume 作为 Spark Streaming 数据源的编程方法。 二、实验平台 操作系统: Ubuntu16.04 Spark 版本:2.1.0 Flume 版本:1.7.0 三、实验内容和要求 1.安 阅读全文
posted @ 2021-01-30 12:03 大米粒o 阅读(1566) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-01-29 19:30 大米粒o 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 实验目的 1.了解循环神经网络的原理 2.掌握循环神经网络的操作 实验原理 RNN的网络结构及原理 RNNs包含输入单元(Input units),输入集标记为{x0,x1,...,xt,xt+1,...},而输出单元(Output units)的输出集则被标记为{y0,y1,...,yt,yt+1 阅读全文
posted @ 2021-01-28 16:55 大米粒o 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 学习视频:http://cookdata.cn/auditorium/course_room/10014/ 用回归解决分类 三种算法 1、感知机(Perceptron) 概念:找到一条直线,讲两类数据分开即可 2、支持向量机(Support Vector Machines) 概念:找到一条直线,不仅 阅读全文
posted @ 2021-01-28 10:49 大米粒o 阅读(154) 评论(1) 推荐(0) 编辑
摘要: 一、实验目的 (1)通过实验掌握基本的 MLLib 编程方法; (2)掌握用 MLLib 解决一些常见的数据分析问题,包括数据导入、成分分析和分类和 预测等。 二、实验平台 操作系统:Ubuntu16.04 JDK 版本:1.7 或以上版本 Spark 版本:2.1.0 数据集:下载 Adult 数 阅读全文
posted @ 2021-01-27 23:37 大米粒o 阅读(1943) 评论(1) 推荐(0) 编辑
摘要: 学习视频:http://cookdata.cn/auditorium/course_room/10013/ 在回归模型中,需要预测的变量叫做因变量,用来解释的变量变化的变量叫做自变量; 相关性质:若A为可逆矩阵,则其逆矩阵是唯一的 是否可逆:行列式不等于0、满秩、行(或列)向量组线性无关 ..... 阅读全文
posted @ 2021-01-27 20:48 大米粒o 阅读(63) 评论(0) 推荐(0) 编辑
摘要: import pandas as pd %matplotlib inline raw_train = pd.read_csv("./input/train_sample_utf8.csv",encoding="utf8") raw_test = pd.read_csv("./input/test_s 阅读全文
posted @ 2021-01-26 11:30 大米粒o 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 一、实验目的 (1)通过实验掌握 Spark SQL 的基本编程方法; (2)熟悉 RDD 到 DataFrame 的转化方法; (3)熟悉利用 Spark SQL 管理来自不同数据源的数据。 二、实验平台 操作系统: Ubuntu16.04 Spark 版本:2.1.0 数据库:MySQL 三、实 阅读全文
posted @ 2021-01-25 16:42 大米粒o 阅读(1888) 评论(0) 推荐(0) 编辑
摘要: 一、实验目的 (1)熟悉 Spark 的 RDD 基本操作及键值对操作; (2)熟悉使用 RDD 编程解决实际具体问题的方法。 二、实验平台 操作系统:Ubuntu16.04 Spark 版本:2.1.0 三、实验内容和要求 1.spark-shell 交互式编程 请到本教程官网的“下载专区”的“数 阅读全文
posted @ 2021-01-24 13:22 大米粒o 阅读(710) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 22 下一页