随笔分类 -  大数据学习之路

总结大数据工程师学习内容
摘要:-0.机器学习常用的模型:例如,线性模型、逻辑回归、Softmax、神经网络/深度学习、SVM、决策树、随机森林、GBDT、矩阵分解。 -1.神经网络在一个数据集上训练成型的深度神经网络,在另外一个完全不同的数据集上只需稍加训练,就有可能适应和完成那个新的任务。(迁移学习 Transfer Lear 阅读全文
posted @ 2020-12-28 15:52 tuanz 阅读(213) 评论(0) 推荐(0)
摘要:http://mirror.bit.edu.cn/pentaho/ 阅读全文
posted @ 2020-08-13 16:37 tuanz 阅读(898) 评论(0) 推荐(0)
摘要:来源:第四章:大数据 の HBase 基础 本课主题 NoSQL 数据库介绍 HBase 基本操作 HBase 集群架构与设计介紹 HBase 与HDFS的关系 HBase 数据拆分和紧缩 引言 介绍什么是 NoSQL,NoSQL 和 RDBMS 之间有什么区别,有什么埸景下需要用 NoSQL 数据 阅读全文
posted @ 2018-05-08 09:11 tuanz 阅读(294) 评论(0) 推荐(0)
摘要:Hadoop家族 整个Hadoop家族由以下几个子项目组成: Hadoop Common: Hadoop体系最底层的一个模块,为Hadoop各子项目提供各 种工具,如:配置文件和日志操作等。 HDFS: 是Hadoop应用程序中主要的分布式储存系统, HDFS集群包含了一个NameNode(主节点) 阅读全文
posted @ 2018-04-17 17:23 tuanz 阅读(5441) 评论(0) 推荐(0)