随笔分类 -  ZZZ

摘要:原文链接:https://developers.google.com/machine-learning/crash-course/embeddings/ 嵌套是一种相对低维的空间,可以将高维矢量映射到这种低维空间里。通过使用嵌套,可以让在大型输入(比如代表字词的稀疏矢量)上进行机器学习变得更加容易。 阅读全文
posted @ 2019-02-02 23:16 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/multi-class-neural-networks/ 多类别分类,这种模型可从多种可能的情况中进行选择。 1- 一对多 一对多提供了一种利用二元分类的方法。鉴于一个分 阅读全文
posted @ 2019-02-01 23:30 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/training-neural-networks/ 反向传播算法是最常见的一种神经网络训练算法。借助这种算法,梯度下降法在多层神经网络中将成为可行方法。TensorFlo 阅读全文
posted @ 2019-02-01 23:07 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/introduction-to-neural-networks/ 神经网络是更复杂版本的特征组合。实质上,神经网络会学习适合相应特征组合。 1- 剖析 “非线性问题”意味 阅读全文
posted @ 2019-02-01 07:29 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/regularization-for-sparsity/ 1- L₁正则化 稀疏矢量通常包含许多维度。创建特征组合会导致包含更多维度。由于使用此类高维度特征矢量,因此模型 阅读全文
posted @ 2019-01-31 23:58 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/classification/ 1- 指定阈值 为了将逻辑回归值映射到二元类别,必须指定分类阈值(也称为判定阈值)。如果值高于该阈值,则表示“1”;如果值低于该阈值,则表 阅读全文
posted @ 2019-01-30 00:13 Anliven
摘要:01 - 10 01 - Machine learning infographic 图片解读机器学习的基本概念、五大流派与九种常见算法 EN:http://usblogs.pwc.com/emerging-technology/machine-learning-101/ CN:https://zhu 阅读全文
posted @ 2019-01-29 23:23 Anliven
摘要:1 - Scikit-Learn Sklearn(scikit-learn: machine learning in Python):https://scikit-learn.org/ 文档丰富而又详细,提供了练习数据、相关代码实例和可视化图,是少数写的跟教程一样的技术文档。 官方信息 安装scik 阅读全文
posted @ 2019-01-29 23:06 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/logistic-regression/ 逻辑回归会生成一个介于 0 到 1 之间(不包括 0 和 1)的概率值,而不是确切地预测结果是 0 还是 1。 1- 计算概率 阅读全文
posted @ 2019-01-28 00:22 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/regularization-for-simplicity 正则化指的是降低模型的复杂度以减少过拟合。 1- L₂正则化 泛化曲线:显示的是训练集和验证集相对于训练迭代次 阅读全文
posted @ 2019-01-21 23:43 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/feature-crosses/ 特征组合是指两个或多个特征相乘形成的合成特征。特征的相乘组合可以提供超出这些特征单独能够提供的预测能力。 1- 对非线性规律进行编码 特 阅读全文
posted @ 2019-01-19 03:58 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/representation/ 机器学习模型不能直接看到、听到或感知输入样本。必须创建数据表示,为模型提供有用的信号来了解数据的关键特性。也就是说,为了训练模型,必须选择 阅读全文
posted @ 2019-01-17 00:30 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/validation/ 1- 检查直觉 将一个数据集划分为训练集和测试集,可以对一个样本集进行训练,然后使用不同的样本集测试模型。工作流程如下: 在“调整模型”阶段,可以 阅读全文
posted @ 2019-01-16 23:44 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/training-and-test-sets 测试集是用于评估根据训练集开发的模型的数据集。 1- 拆分数据 可将单个数据集拆分为一个训练集和一个测试集。 训练集 - 用 阅读全文
posted @ 2019-01-16 23:18 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/generalization 泛化是指模型很好地拟合以前未见过的新数据(从用于创建该模型的同一分布中抽取)的能力。 1- 过拟合的风险 机器学习的目标是对从真实概率分布( 阅读全文
posted @ 2019-01-13 22:59 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/first-steps-with-tensorflow/ 1- 工具包 TensorFlow工具包的层次结构 Estimator (tf.estimator): 高级 O 阅读全文
posted @ 2019-01-13 22:20 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/reducing-loss/ 为了训练模型,需要一种可降低模型损失的好方法。迭代方法是一种广泛用于降低损失的方法,而且使用起来简单有效。 1- 迭代方法 用于训练模型的迭 阅读全文
posted @ 2019-01-12 00:06 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/descending-into-ml/ 线性回归是一种找到最适合一组点的直线或超平面的方法。 1- 线性回归 线性回归是一种找到最适合一组点的直线或超平面的方法。 以数学 阅读全文
posted @ 2019-01-10 23:53 Anliven
摘要:原文链接:https://developers.google.com/machine-learning/crash-course/framing (监督式)机器学习的定义:机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。 1- 基本术语 1.1- 标签 标签是要预测的事物,即简 阅读全文
posted @ 2019-01-10 23:18 Anliven
摘要:1 - MLCC 通过机器学习,可以有效地解读数据的潜在含义,甚至可以改变思考问题的方式,使用统计信息而非逻辑推理来处理问题。 Google的机器学习速成课程(MLCC,machine-learning crash-course):https://developers.google.com/mach 阅读全文
posted @ 2019-01-07 00:13 Anliven