随笔分类 - 机器学习
摘要:tfrecord生成 tfrecord读取 尺寸不固定矩阵的存储和读取 统计数据条数
阅读全文
摘要:拉去tensorflow srving 镜像 代码里新增tensorflow 配置代码 启动服务 访问服务 预测结果 遗留问题 tensorflow serving 保存的时侯,只保存了,模型graphy相关的操作。数据预处理操作,不在serving服务中。 所以数据的预处理等,需要重新做。 可不可
阅读全文
摘要:版本 import tensorflow as tf import sys import os current_dir = os.path.abspath(os.path.dirname(__file__)) sys.path.append(current_dir + '/..') import m
阅读全文
摘要:1. 目前所在公司的核心产品,是放疗图像的靶区自动勾画。 2. 使用深度学习技术,学习放疗样本,能够针对不同的器官,进行放疗靶区的勾画。 3. 使用CNN搭建FCN/U Net网络结构,训练模型,使模型获得图像语义分隔的能力。(自动驾驶,无人机落点判定都是属于语义分割范畴)。 FCN模型结构 模型结
阅读全文
摘要:1.sigmod函数 $$ \sigma(x)=\frac{1}{1+e^{ x}} $$ sigmod函数的输出值再(0,1)这个开区间中,经常被用来映射为概率值。 sigmod函数作为激活函数曾经比较流行。 缺陷 当输入稍微远离了坐标原点,函数的梯度就变得很小了,几乎为零。当反向传播经过了sig
阅读全文
摘要:注意力seq2seq模型 大部分的seq2seq模型,对所有的输入,一视同仁,同等处理。 但实际上,输出是由输入的各个重点部分产生的。 比如: (举例使用,实际比重不是这样) 对于输出“晚上”, 各个输入所占比重: 今天 50%,晚上 50%,吃 100%,什么 0% 对于输出“吃”, 各个输入所占
阅读全文
摘要:在做seq2seq的时候,经常需要使用sequence_loss这是损失函数。 现在分析一下sequence_loss这个函数到底在做什么 求loss值 $$ logits=\left[\begin{matrix} [1.0, 2.0] & [1.0, 2.0] \cr [1.0, 2.0] & [
阅读全文
摘要:使用典型seq2seq模型,得到的结果欠佳,怎么解决 结果欠佳原因在这里 在训练阶段的decoder,是将目标样本["吃","兰州","拉面"]作为输入下一个预测分词的输入。 而在预测阶段的decoder,是将上一个预测结果,作为下一个预测值的输入。(注意查看预测多的箭头) 这个差异导致了问题的产生
阅读全文
摘要:原创文章,转载请注明出处 最近完成了sqe2seq聊天模型,磕磕碰碰的遇到不少问题,最终总算是做出来了,并符合自己的预期结果。 本文目的 利用流程图,从理论方面,回顾,总结seq2seq模型, seq2seq概念 你给模型一段输入,它返回一段输出! 可以用在这些情景,聊天模型、翻译、看图说话、主旨提
阅读全文
摘要:lstm的前向结构,不迭代 最基本的lstm结构。不涉及损失值和bp过程 用lstm对mnist数据分类
阅读全文
摘要:背景 神经网络,卷积神经网络等其他深度学习算法,都有个局限性,各个输入在算法内部是相对独立的。比如:‘星际争霸有意思,我爱玩’这句话,是有上下文关系的。 如果放在其他网络里面,各个分词将会独立处理。但是在rnn里面,可以将上文记忆下来,做为下文的运算基础。 总之:rnn适合用来解决具有上下文关系的算
阅读全文
摘要:论文pdf 地址:https://arxiv.org/pdf/1609.04802v1.pdf 我的实际效果 清晰度距离我的期待有距离。 颜色上面存在差距。 解决想法 增加一个颜色判别器。将颜色值反馈给生成器 srgan论文是建立在gan基础上的,利用gan生成式对抗网络,将图片重构为高清分辨率的图
阅读全文
摘要:通过GAN生成式对抗网络,产生mnist数据 引入包,数据约定等 GAN对象结构 生成器函数 对随机值z(维度为1,100),进行包装,伪造,产生伪造数据。 包装过程概括为:全连接 reshape 反卷积 包装过程中使用了batch_normalization,Leaky ReLU,dropout,
阅读全文
摘要:代码实现 当初学习时,主要学习的这个博客 https://xyang35.github.io/2017/08/22/GAN 1/ ,写的挺好的。 本文目的,用GAN实现最简单的例子,帮助认识GAN算法。 2. 真实数据集,我们要通过GAN学习这个数据集,然后生成和他分布规则一样的数据集 3.封装GA
阅读全文
摘要:生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型 GAN包括两个核心模块。 1.生成器模块 generator 2.判别器模块 desciminator GAN通俗原理解释 为了通俗的解释GAN原理,可以类比为伪造货币的例子(这个比方纯粹
阅读全文

浙公网安备 33010602011771号