yyyyyyyyyyyyyyyyyyyy

博客园 首页 新随笔 联系 订阅 管理

2016年11月8日 #

摘要: MLlib: RDD-based API This page documents sections of the MLlib guide for the RDD-based API (the spark.mllib package). Please see the MLlib Main Guide  阅读全文
posted @ 2016-11-08 11:41 xxxxxxxx1x2xxxxxxx 阅读(290) 评论(0) 推荐(0)

摘要: 目前所有的ANN神经网络算法大全 目前所有的ANN神经网络算法大全 概述 1 BP神经网络 1.1 主要功能 1.2 优点及其局限性 2 RBF(径向基)神经网络 2.1 主要功能 2.2 优点及其局限性 3 感知器神经网络 3.1 主要功能 3.2 优点及其局限性 4 线性神经网络 4.1 主要功 阅读全文
posted @ 2016-11-08 11:40 xxxxxxxx1x2xxxxxxx 阅读(1429) 评论(0) 推荐(0)

摘要: Spark1.6.1 MLlib 特征抽取和变换 1 TF-IDF TF-IDF是一种特征向量化方法,这种方法多用于文本挖掘,通过算法可以反应出词在语料库中某个文档中的重要性。文档中词记为t,文档记为d , 语料库记为D . 词频TF(t,d) 是词t 在文档d 中出现的次数。文档频次DF(t,D) 阅读全文
posted @ 2016-11-08 11:34 xxxxxxxx1x2xxxxxxx 阅读(438) 评论(0) 推荐(0)

摘要: 【注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、MLlib实例 1.1 聚类实例 1.1.1 算法说明 聚类(Cluster analysis)有时也被翻译为簇类,其核心任务是:将一组目标object划分为若干个簇,每个簇之间的object尽可能相 阅读全文
posted @ 2016-11-08 11:33 xxxxxxxx1x2xxxxxxx 阅读(337) 评论(0) 推荐(0)

摘要: Spark入门实战系列--8.Spark MLlib(上)--机器学习及SparkMLlib简介 1、机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: l“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 l“机 阅读全文
posted @ 2016-11-08 11:31 xxxxxxxx1x2xxxxxxx 阅读(328) 评论(0) 推荐(0)

摘要: excel中如何筛选功能的使用 excel中如何筛选功能的使用 excel是一款数据处理工具,可以在众多的数据中找到想要的经过处理之后的数据,而最直接方便的功能就是筛选。请阅读下文,了解如何对数据进行筛选。 如下图所示的学生成绩中,我们要达到的目的是,找出所有王姓同学的相关成绩: 依次单击“数据,筛 阅读全文
posted @ 2016-11-08 10:27 xxxxxxxx1x2xxxxxxx 阅读(2814) 评论(0) 推荐(0)