会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
ZacksTang
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
4
5
6
7
8
9
10
11
12
···
15
下一页
2020年2月16日
分类问题(一)MINST数据集与二元分类器
摘要: 分类问题 在机器学习中,主要有两大类问题,分别是分类和回归。下面我们先主讲分类问题。 MINST 这里我们会用MINST数据集,也就是众所周知的手写数字集,机器学习中的 Hello World。sk-learn 提供了用于直接下载此数据集的方法: from sklearn.datasets impo
阅读全文
posted @ 2020-02-16 13:56 ZacksTang
阅读(1812)
评论(0)
推荐(1)
2020年2月15日
机器学习项目流程(五)模型调优
摘要: 模型微调 假设我们现在已经有了几个效果还不错的模型,接下来我们要对它们进行调优。下面我们介绍几种调优的方法。 网格搜索 第一个方法是通过手动调整超参数,直到发现一组使模型表现良好的超参数。这个是一个很耗时的工作,手动调整的话,可能没有这么多时间探索这些超参数组合。 不过在sk-learn 中提供了G
阅读全文
posted @ 2020-02-15 21:27 ZacksTang
阅读(1535)
评论(1)
推荐(1)
机器学习项目流程(四)选择并训练模型
摘要: 选择并训练模型 至此,我们已明确了问题,并对数据进行了预处理。现在我们选择并训练一个机器学习模型。 在训练集上训练模型 这个过程相对来说较为简单,我们首先训练一个线性回归模型: from sklearn.linear_model import LinearRegression lin_reg = L
阅读全文
posted @ 2020-02-15 13:41 ZacksTang
阅读(1415)
评论(0)
推荐(0)
2020年1月17日
机器学习项目流程(三)为机器学习准备数据
摘要: 为机器学习准备数据 下面我们开始为机器学习算法准备数据,首先我们将训练集中的 label(也就是median_house_value)分出来: housing = strat_train_set.drop('median_house_value', axis=1) housing_labels =
阅读全文
posted @ 2020-01-17 16:06 ZacksTang
阅读(1058)
评论(0)
推荐(0)
2020年1月10日
机器学习项目流程(二)探索并可视化数据
摘要: 探索并可视化数据 到目前为止我们已经大致浏览了数据集,我们下一步的目标是更深入的了解数据集。 首先,我们要将测试集放在一边,确保我们仅浏览训练集。当然,如果训练集特别大的话,我们可能需要对它进行采样,获取它的一个小样本集进行研究。在我们的这个例子中,这个数据集非常小,所以我们可以直接在整个训练集上进
阅读全文
posted @ 2020-01-10 19:37 ZacksTang
阅读(874)
评论(0)
推荐(0)
机器学习项目流程(一)初探数据集
摘要: 机器学习项目流程 在这我们会从头开始做一个机器学习项目,向大家展示一个机器学习项目的一个基本流程与方法。一个机器学习主要分为以下几个步骤: 从整体上了解项目 获取数据 发现并可视化数据,以深入了解数据 为机器学习算法准备数据 选择模型并训练 模型调优 展示解决方案 部署、监控、以及维护我们的系统 我
阅读全文
posted @ 2020-01-10 15:13 ZacksTang
阅读(1812)
评论(0)
推荐(0)
2019年12月11日
Elasticsearch 入门
摘要: 1. 术语 在 ElasticSearch 中,存入一个文件的动作称为索引(indexing)。对比传统关系型数据库,ElasticSearch中的类比为: Relational DB -> Databases -> Tables -> Rows -> Columns Elasticsearch -
阅读全文
posted @ 2019-12-11 12:53 ZacksTang
阅读(367)
评论(0)
推荐(0)
2019年11月27日
Docker(二)Image 与网络
摘要: Docker Image 我们介绍一下如何构造一个自定义的 Docker Image。在Docker 中,我们使用Dokcerfile 构建一个docker的描述。 首先我们定义一下需要启动一个什么应用,以 web app 为例,我们有以下需求: 操作系统:centos 更新软件:yum -y up
阅读全文
posted @ 2019-11-27 09:53 ZacksTang
阅读(296)
评论(0)
推荐(0)
2019年11月26日
Docker(一)概念与基础
摘要: Docker 基础 为什么需要docker?在传统部署下,我们会遇到不同机器、不同依赖版本的兼容性等问题,解决此问题一般会消耗大量时间,并且在不同机器上均要执行统一环境的部署也是一个耗时较长的工作。除此之外、还包括例如管理Dev/Test/Prod等不同环境的成本。为了解决这些问题,Docker应运
阅读全文
posted @ 2019-11-26 13:04 ZacksTang
阅读(315)
评论(0)
推荐(0)
2019年11月22日
Apache Hudi 介绍与应用
摘要: Apache Hudi Apache Hudi 在基于 HDFS/S3 数据存储之上,提供了两种流原语: 插入更新 增量拉取 一般来说,我们会将大量数据存储到HDFS/S3,新数据增量写入,而旧数据鲜有改动,特别是在经过数据清洗,放入数据仓库的场景。而且在数据仓库如 hive中,对于update的支
阅读全文
posted @ 2019-11-22 17:39 ZacksTang
阅读(15462)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
11
12
···
15
下一页
公告