2019年4月15日

数据仓库

摘要: ETL的定义: 将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程 使分析和事务处理不冲突 (参考https://blog.csdn.net/Trigl/article/details/68944434 HDFS:Hadoop分布式文件系统 阅读全文

posted @ 2019-04-15 23:04 ZoraZheng 阅读(117) 评论(0) 推荐(0)

2019年4月7日

统计知识集合

摘要: 统计检验方法 t检验 T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著 t-检验的假设是检验的数据满足正态分布,否则对于小样本不满 阅读全文

posted @ 2019-04-07 18:30 ZoraZheng 阅读(145) 评论(0) 推荐(0)

2019年4月4日

推荐系统

摘要: 待完成 阅读全文

posted @ 2019-04-04 09:38 ZoraZheng 阅读(64) 评论(0) 推荐(0)

2019年3月29日

linux命令

摘要: 待完成 阅读全文

posted @ 2019-03-29 11:10 ZoraZheng 阅读(53) 评论(0) 推荐(0)

手撕code和一些数据结构

摘要: 排序 冒泡排序是最简单的排序之一了,其大体思想就是通过与相邻元素的比较和交换来把小的数交换到最前面。这个过程类似于水泡向上升一样,因此而得名。举个栗子,对5,3,8,6,4这个无序序列进行冒泡排序。首先从后向前冒泡,4和6比较,把4交换到前面,序列变成5,3,8,4,6。同理4和8交换,变成5,3, 阅读全文

posted @ 2019-03-29 10:32 ZoraZheng 阅读(155) 评论(0) 推荐(0)

C++

摘要: From C++编程思想) 中英名词记录 回文:正反读都一样 阅读全文

posted @ 2019-03-29 10:31 ZoraZheng 阅读(54) 评论(0) 推荐(0)

面筋收集

摘要: 算法: 阅读全文

posted @ 2019-03-29 10:30 ZoraZheng 阅读(99) 评论(0) 推荐(0)

2019年3月18日

机器学习/算法

摘要: 监督学习/supervised learning: 有X和Y 常见的有监督学习算法:回归分析regression和统计分类classification。最典型的算法是KNN和SVM 非监督学习: 只有X 需要根据样本间的相似性对样本集进行分类(聚类,clustering)试图使类内差距最小化,类间差 阅读全文

posted @ 2019-03-18 23:15 ZoraZheng 阅读(252) 评论(0) 推荐(0)

导航