posted @ 2019-04-14 19:23 心默默言 阅读(216) 评论(0) 推荐(0)
摘要:
K-Means原理初探 K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。 如果我们想直接求上式的最小值并不容易,这是一个NP难的问题,因此只能采用启发式的迭代方法。 K-Means采用的启发式方式很 阅读全文
摘要:
PCA——主成分分析 简介 PCA全称Principal Component Analysis,即主成分分析,是一种常用的数据降维方法。它可以通过线性变换将原始数据变换为一组各维度线性无关的表示,以此来提取数据的主要线性分量。 z=wTx 其中,z为低维矩阵,x为高维矩阵,w为两者之间的映射关系。假 阅读全文
posted @ 2019-04-09 20:47 心默默言 阅读(771) 评论(0) 推荐(0)
摘要:
Linux环境配置 修改ip地址 1,图形化界面 2,setup 命令虚拟界面 3,修改配置文件(以网络方式为NAT示例) vi /etc/sysconfig/network-scripts/ifcfg-eth0 BOOTPROTO=static ONBOOT=yes IPADDR=192.168. 阅读全文
posted @ 2019-04-09 16:31 心默默言 阅读(115) 评论(0) 推荐(0)
摘要:
降维技术 对数据进行降维有如下一系列的原因: 在以下3种降维技术中, PCA的应用目前最为广泛,因此本章主要关注PCA。 主成分分析(Principal Component Analysis, PCA) 通俗理解:就是找出一个最主要的特征,然后进行分析。 在PCA中,数据集从原始坐标系转换为新的坐标 阅读全文
posted @ 2019-04-08 11:28 心默默言 阅读(334) 评论(0) 推荐(0)
摘要:
https://blog.csdn.net/weixin_40123108/article/details/84378202 In [5]: from time import time import logging #程序进展信息 import matplotlib.pyplot as plt fr 阅读全文
posted @ 2019-04-07 10:04 心默默言 阅读(474) 评论(0) 推荐(0)
摘要:
1.Linux简介 UNIX与Linux发展史 Unix在1969年,美国贝尔实验室的肯汤普森在DEC PDP-7机器上开发出了UNIX系统。 Linux出现于1991年,是由芬兰赫尔辛基大学学生李纳斯·托瓦兹(Linus Torvalds)和后来加入的众多爱好者共同开发完成 。 Linux介绍 L 阅读全文
posted @ 2019-04-03 19:18 心默默言 阅读(330) 评论(0) 推荐(0)
摘要:
CentOS6.9及CentOS7.4的安装详细步骤 安装前的准备工作:1 VMware已经安装好2 镜像文件下载好(在这里,我用的是CentOS-6.9-x86_64-bin-DVD1.iso和CentOS-7-x86_64-Everything-1708.iso)一 6.9 安装步骤如下:1 打 阅读全文
posted @ 2019-04-02 15:38 心默默言 阅读(225) 评论(0) 推荐(0)
摘要:
https://www.cnblogs.com/zhoujingyu/p/5040957.html https://blog.csdn.net/firstchange/article/details/78567456 HDFS数据存储元(block) - 文件被切分成固定大小的数据块 默认数据块大小 阅读全文
posted @ 2019-03-28 19:39 心默默言 阅读(225) 评论(0) 推荐(0)
摘要:
Hadoop思想之源:Google 面对的数据和计算难题 ——大量的网页怎么存储 ——搜索算法 带给我们的关键技术和思想(Google三篇论文) ——GFS(hdfs) ——Map-Reduce ——Bigtable Hadoop创始人介绍: Hadoop作者Doug cutting,就职Yahoo 阅读全文
posted @ 2019-03-28 19:36 心默默言 阅读(390) 评论(0) 推荐(0)
浙公网安备 33010602011771号