总访问量: PV

DataScience && DataMining && BigData

摘要: Python数据分析必备: 1.Anaconda操作 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。Anaconda利用工具/命令conda 阅读全文
posted @ 2017-05-26 16:53 CJZhaoSimons 阅读(4726) 评论(1) 推荐(0)
摘要: 1.Sublime3的下载地址:http://www.sublimetext.com/3 2.刚刚安装的软件是没有PackageControl的,需要在新安装使用 (1) 以前没有安装过Package Control插件的,请先安装Package Control插件。进入https://packag 阅读全文
posted @ 2017-05-18 11:06 CJZhaoSimons 阅读(1152) 评论(0) 推荐(0)
摘要: 1.选择File-Setting-输入Scala后可点击下载 2.选择New创建Project 3.构建Scala程序的两种方式: 3.1 选择Scala之后选择SBT构建方式构建Scala程序 或者3.2 直接选择Scala应用程序构建Scala代码 4.根据上述3.1的SBT构建方式键入项目名称 阅读全文
posted @ 2017-05-17 15:32 CJZhaoSimons 阅读(3223) 评论(0) 推荐(0)
摘要: 1.哈弗曼树的节点声明 点击可复制代码 1 package com.neusoft.Tree; 2 3 public class HuffmanNode { 4 public int weight; 5 //加入哈夫曼树的标志,flag=0表示该节点没有加入哈夫曼树,=1表示加入 6 public 阅读全文
posted @ 2017-05-06 10:45 CJZhaoSimons 阅读(577) 评论(0) 推荐(0)
摘要: 1.在二叉树中查找元素值为x的节点的操作 点击可复制代码 1 package com.neusoft.Tree; 2 3 import java.awt.image.RescaleOp; 4 5 /** 6 * @author zhao-chj 7 * 完成在二叉树中查找元素值为x的节点的操作 8 阅读全文
posted @ 2017-05-06 10:40 CJZhaoSimons 阅读(470) 评论(0) 推荐(0)
摘要: 1.Python实现KNN算法 输入:inX:与现有数据集(1xN)进行比较的向量 dataSet:已知向量的大小m数据集(NxM) 个标签:数据集标签(1xM矢量) k:用于比较的邻居数(应为奇数)输出:最受欢迎的类标签(归类问题) 2.数据集(测试集合训练集) 3.KNN测试结果 阅读全文
posted @ 2017-05-03 09:33 CJZhaoSimons 阅读(1104) 评论(1) 推荐(0)
摘要: Scikit-Learn总结 Scikit-Learn(基于Python的工具包) 1.是一个基于Numpy,Scipy,Matplotlib的开源机器学习工具包。 2.该包于2007年发起,基本功能包涵了6个方面:分类、回归、聚类、数据降维、模型选择、预处理 包括了大量常用的算法::SVM,逻辑回 阅读全文
posted @ 2017-05-03 09:02 CJZhaoSimons 阅读(852) 评论(0) 推荐(0)
摘要: 1.二叉树的节点声明 点击+复制代码 1 package com.neusoft.Tree; 2 /** 3 * @author zhao-chj 4 * 保存Node节点的数据域指针域 5 */ 6 public class BiTreeNode { 7 public Object data;// 阅读全文
posted @ 2017-05-03 08:30 CJZhaoSimons 阅读(945) 评论(0) 推荐(0)
摘要: 1.队列的接口表示 点击展开代码 1 package com.neusoft.Queue; 2 /** 3 * @author zhao-chj 4 * 队列的接口 5 */ 6 public interface IQueue { 7 public void clear(); 8 public bo 阅读全文
posted @ 2017-04-10 20:03 CJZhaoSimons 阅读(341) 评论(0) 推荐(0)
摘要: Anaconda3(python3.6)安装tensorflow Anaconda3中安装tensorflow3是非常简单的,仅需通过 pip install tensorflow 测试代码: 下面文章是之前在Anaconda3中配置Tensorflow库的过程 Anaconda3(python3. 阅读全文
posted @ 2017-04-08 11:29 CJZhaoSimons 阅读(4383) 评论(0) 推荐(0)
摘要: 1.栈的顺序存储<数组实现> 1.1.栈的接口 点击复制代码 1 package com.neusoft.stack; 2 3 public interface IStack { 4 //1.栈置空 5 public void clear(); 6 //2.栈判空 7 public boolean 阅读全文
posted @ 2017-04-06 21:40 CJZhaoSimons 阅读(529) 评论(0) 推荐(0)
摘要: 1.windows下载并安装Anaconda集成环境 URL:https://www.continuum.io/downloads 2.在控制台中测试ipython是否启动正常 3.安装JDK 3.1环境变量配置: 3.2测试: 4.安装Spark并配置环境变量 4.1 URL: http://sp 阅读全文
posted @ 2017-04-05 08:39 CJZhaoSimons 阅读(20992) 评论(0) 推荐(0)
摘要: 语法:使用表达式定义值和变量 val <identifier>[:<type>]=<expression> 字面值类型 var <identifier>[:<type>]=<expression> 变量类型 实例1: 同一级定义类型 scala> val x=5*20;val amount=x+10 阅读全文
posted @ 2017-04-05 08:14 CJZhaoSimons 阅读(386) 评论(0) 推荐(0)
摘要: 1.下载R 1.1 下载URL:https://cran.r-project.org/src/base/R-3/ 1.2 环境变量配置 1.3 测试安装: 2.下载Rtools33 URL:https://cran.r-project.org/bin/windows/Rtools/ 2.1 配置环境 阅读全文
posted @ 2017-03-30 21:49 CJZhaoSimons 阅读(484) 评论(0) 推荐(0)
摘要: 1.ALS算法流程: 初始化数据集和Spark环境 > 切分测试机和检验集 > 训练ALS模型 > 验证结果 > 检验满足结果 >直接推荐商品,否则继续训练ALS模型 2.数据集的含义 Rating是固定的ALS输入格式,要求是一个元组类型的数据,其中数值分别是如下的[Int,Int,Double] 阅读全文
posted @ 2017-03-30 20:15 CJZhaoSimons 阅读(5587) 评论(0) 推荐(1)