摘要:
先验概率 概率是认知史上一次重要的进步,狭义的来说,概率代表一件事发生的几率,但广义上来看,概率代表了一种分布特征;典型的以男女比例来说,生男生女都是50%的几率,在没有人为干扰的情况下,社会的上的男女比例接近于1:1。先验概率是在条件单一的情况下的分布特征,往往聚焦于某一场景或者维度。 后验概率 阅读全文
posted @ 2020-05-18 18:29
Cshare
阅读(144)
评论(0)
推荐(0)
摘要:
这一部分很有意思,主要是搞清楚这个世界是如何变化的,同时会将数学分析里面一些基本的概念联系起来 数学分析 连续 数学分析开篇讲极限,随后就讲连续,连续性为何如此重要,举个例子,文学作品里常常有这样的题材,假如穿越到过去会怎么样,假如穿越到未来会怎么样,这类题材将过去和现在,以及现在和过去看成一个个孤 阅读全文
posted @ 2020-05-18 18:27
Cshare
阅读(143)
评论(0)
推荐(0)
摘要:
一张纸是白色的,正方形的,薄薄的物体,把它揉成一团就变成了圆形的,厚厚的物体,那么如何来明确描述这张纸呢?里面蕴含着深刻的哲理,要想清晰的描述事物,需要从定性和定量这两个角度考量。从定性上来看,可以从颜色,形状,厚度这三个属性来观察;从定量上来看,前面的纸对应着白色,正方形,0.1毫米,后面的纸则对 阅读全文
posted @ 2020-05-18 18:19
Cshare
阅读(120)
评论(0)
推荐(0)
摘要:
数据是信息的载体,反应客观事实的一部分,它由两部分构成,一是指标,一是内容,分别对应定性和定量。 指标 指标是对业务定性的表达,它需要记录业务流的每个节点,并在业务结构发生变化时,也随之变化,业务流可以看成一张RoadMap,指标就是路标,来反应整个业务图的客观状态以及结构,变动等等。指标设计时需要 阅读全文
posted @ 2020-05-18 18:18
Cshare
阅读(1112)
评论(0)
推荐(0)
摘要:
描述数据时,需要从许多维度来观察,在Excel里透视表就承担着这个功能,透视表由3个层构成:数据层、转换层、可视化层 数据层 本地 透视表只能加载矩阵格式的数据,首行是标题,首行以下的是具体内容,透视表可以通过详细的路径选择数据范围,注意,如果选择的是A1:B2这样具体的范围,则数据进行往后追加时, 阅读全文
posted @ 2020-05-18 18:16
Cshare
阅读(672)
评论(0)
推荐(0)
摘要:
Excel的函数有上千种,常用的只有几十种,包含两个类别f(x),f(x,y),参数的类型又对应数字,文本,日期,整个的函数集合构成是2X3,掌握这个不等式,就可以轻松应对各种数据处理场景。 f(x)型 数字 =ROUND(4.56789,1) =MOD(21,4) =SUMIF(D37:D38," 阅读全文
posted @ 2020-05-18 18:14
Cshare
阅读(207)
评论(0)
推荐(0)
摘要:
安装 配置服务 启动服务 工作原理 RDD、DateFrame和SparkSQL SparkStreaming和Structured Streaming MLlib GraphX 阅读全文
posted @ 2020-05-18 18:12
Cshare
阅读(138)
评论(0)
推荐(0)
摘要:
安装 配置HA模式 启动 工作原理 在推荐算法中,一篇文章会被解析成上亿维的向量,所有文章构成的矩阵是一个巨大的稀疏矩阵,Hbase就是为了存储这个巨大矩阵而衍生出来的产物;由于它的稀疏性,数据都是一块一块的,其他绝大部分都是空的,Hbase就是基于HDFS,将向量的上亿维度,通过3级树形结构来降维 阅读全文
posted @ 2020-05-18 18:06
Cshare
阅读(94)
评论(0)
推荐(0)
摘要:
安装 在SecureCRT中通过sftp上传到虚拟机 解压缩 系统环境 配置Zookeeper 分别启动各组件 原理 当数据量多的时候,单机无法处理,Hadoop是为了解决海量计算而应运而生的方案,包含3和方面:存储平台,计算逻辑,计算资源 存储平台对应HDFS,将数据看成矩阵,它由两部分构成,方向 阅读全文
posted @ 2020-05-18 18:02
Cshare
阅读(222)
评论(0)
推荐(0)
摘要:
Window系统下安装 下载点这里mysql安装包,按提示安装即可,注意使用传统的加密方式,chacha20和sha256加密方式需要额外的组件才能使用,许多客户端也就不支持这些加密方式。 Linux系统下安装 通过yum安装 shell> wget https://dev.mysql.com/ge 阅读全文
posted @ 2020-05-18 18:00
Cshare
阅读(95)
评论(0)
推荐(0)
摘要:
SQL语句 mysql 一:设计数据库 1.数据库(DATABASE) 创建:mysql CREATE DATABASE d1; 删除:mysql DROP DATABASE d1; 查看:mysql SHOW DATABASES; mysql SELECT DATABASE(); mysql SH 阅读全文
posted @ 2020-05-18 17:46
Cshare
阅读(251)
评论(0)
推荐(0)
摘要:
SQL 高效排版指北 统一 SQL 排版的相关用法,极大提高编写和维护 SQL 的效率。 注: column = 选取的字段;table = 选取的表名 语句结构 错误 正确 解析 SQL 语句在内部执行时会解析成树状展开的结构,SELECT,FROM,WHERE 等关键字定义了结构体,这些关键词统 阅读全文
posted @ 2020-05-18 17:44
Cshare
阅读(593)
评论(0)
推荐(0)
摘要:
要素改革方向定义了数据成为生产要素的一环,再加上2025规划,以及互联网发展到第三阶段,政府部门和传统企业会爆发出更多的信息化需求,这种需求具有十足的优化属性,对数据的需求从体量和质量上都会有更高的要求,同理,互联网企业由于普遍增长匮乏,对业务的优化需求也在持续而缓慢的增长,市场上关于数据的岗位需求 阅读全文
posted @ 2020-05-18 13:52
Cshare
阅读(147)
评论(0)
推荐(0)
摘要:
新装的虚拟机还不能直接使用,需要为它配置环境,主要配置网卡、DNS、主机名、hosts、ssh、防火墙、时间 网卡 设置固定网卡,参考【1】 这里使用桥接的方式连接宿主机,并给虚拟机分配固定IP 注意事项 关闭宿主机防火墙 第一台虚拟机需要通过Hyper v配置网卡和ssh,以便在宿主机中可以通过s 阅读全文
posted @ 2020-05-18 11:40
Cshare
阅读(78)
评论(0)
推荐(0)
摘要:
Hyper-V Hyper-V是windows系统自带的虚拟机,使用时要满足两点 Bios里开启CPU虚拟化,可以在任务管理器 - 性能里查看是否支持虚拟化 教育版和家庭版不支持启用Hyper-V,最好是企业版和专业版 启用方式 控制面板\程序\程序和功能 - 启用或关闭Windows功能 - Hy 阅读全文
posted @ 2020-05-18 11:35
Cshare
阅读(121)
评论(0)
推荐(0)

浙公网安备 33010602011771号