随笔分类 - 机器学习
摘要:从csv文件构建Tensorflow的数据集 当我们有一系列CSV文件,如何构建Tensorflow的数据集呢? 基本步骤 获得一组CSV文件的路径 将这组文件名,转成文件名对应的dataset ⇒ file_dataset 根据file_dataset中的每个文件名,读取文件内容 生成一个内容的d
阅读全文
摘要:Tensorflow 基础API 自定义损失函数 def customize_mse(y_true, y_pred): return tf.reduce_mean(tf.square(y_pred - y_true)) model.compile(loss=customize_mse, optimi
阅读全文
摘要:什么是超参数 在神经网络的村联过程中不变的参数 有哪些是超参数 网络结构参数:几层, 每层宽度,每层的激活函数等 训练参数: batch_size, 学习率, 学习率衰减算法等 为什么要超参数搜索 搜索策略 网格搜索 定义N维方格, 每个方格对应一组超参数,一组一组的尝试,直到找到最好的组合方式。
阅读全文
摘要:归一化和批归一化 归一化 归一化: 使数据映射成均值为0,方差为1 的正态分布 类型 min-max归一化: x' = (x -min) / (max - min) z-score归一化: x' = (x - μ) / σ μ是均值 σ是方差 mean归一化: x' = (x -μ) / (max
阅读全文
摘要:wide & Deep模型 稀疏特征 稀疏特征就是离散值特征,比如一个人的性别,就是男或者女, 没有其他的选项,是一个离散值。 像这样只能从有限个选项中选择的数据叫做稀疏特征 稀疏特征的优缺点 优: 叉乘(点积)后有意义, 可以帮助获取共现信息,从而实现记忆效果 两个稀疏特征A和B A是性别[M,
阅读全文
摘要:机器学习解决的问题 分类问题 分类问题预测的是类别,模型的输出是一个概率分布。 概率分布中最大的值对应的索引将被认为是这条数据项所述的类别。 e.g. 三分类问题,模型将输出[0.2, 0.7, 0.1] 那么认为这条数据将被分类为第二类 回归问题 回归问题预测的是一个实数值,模型的输出是一个实数值
阅读全文
摘要:普通MLP处理图像时遇到了什么样的问题,才导致后续各种模型的出现 出现的问题 参数过多 比如输入一张大小为1000x1000的图像, 第一层要使用1000个神经元,下一层的神经元使用106个 那么,全连接参数就是1000 * 1000 * 106 = 10^12 一万亿个参数 这还仅仅是前两层。 很
阅读全文
摘要:图像分类算法为什么有那么多? AlexNet, VGGNet, MobileNet, ResNet, Inception v1 v2 v3 v4... blablabla为什么针对图像的分类算法有这么多,什么时候该用什么。 我好晕啊, 我觉得可能不止我一个人晕吧。 那就接着看吧。 这些算法的来源 首
阅读全文

浙公网安备 33010602011771号