摘要: https://software.intel.com/zh-cn/articles/checkerboard-rendering-for-real-time-upscaling-on-intel-integrated-graphics 关于棋盘格渲染,以上这篇英特尔文章讲的挺清楚的,我这里只是简单c 阅读全文
posted @ 2019-08-04 09:33 sunny,lee 阅读(1464) 评论(1) 推荐(0) 编辑
摘要: 今天在用openvino将pb文件转成ir文件的时候,遇到了一个小问题,记录下来分享给需要的人。 我用tensorflow自己存了个pb文件,具体的方法是在session中加入如下的语句 然后把这个生成的inference_graph.pb文件用mo.py转成openvino识别的.xml和.bin 阅读全文
posted @ 2019-07-24 20:17 sunny,lee 阅读(1687) 评论(0) 推荐(0) 编辑
摘要: ESPCN是twitter2017年提出来的实时视频超分辨率的方法。下面记录下对论文的一些理解。 上面这张图就是整个网络的架构。输入t帧的相邻图像,t-1和t+1,在具体的网络中,有输入连续3张,5张,7张和9张的,在论文中有分析这个对具体效果的影响,这边是以3张为例。逐像素计算t-1和t帧的lr的 阅读全文
posted @ 2019-06-16 21:55 sunny,lee 阅读(2390) 评论(0) 推荐(0) 编辑
摘要: 理论 在混合精度训练中,权重,激活值和梯度是保存成fp16的形式,为了能够匹配fp32的网络精度,有一个权重的fp32的master copy。 在tensorflow中的具体实现 tensorflow支持fp16的存储和tensor计算。包含tf.float16的数据类型的卷积和矩阵运算会自动使用 阅读全文
posted @ 2019-05-02 21:48 sunny,lee 阅读(9760) 评论(1) 推荐(0) 编辑
摘要: openvino是一款可以在Intel CPU/GPU/FPGA/Movidious上进行神经网络加速的软件。官方安装流程见 https://software.intel.com/en-us/openvino-toolkit 。 But在安装的过程中踩了不少坑,下面记录一下,主要是在Windows下 阅读全文
posted @ 2019-02-25 09:31 sunny,lee 阅读(13708) 评论(2) 推荐(0) 编辑
摘要: 在网络训练中,发现生成的图像不对劲,如下面左图所示,文字完全不对。后来发现,是因为在python中把float类型的变量直接转成uint8的时候,负数部分就变成了极大的整数,变成了图中的白点。应该是采用截断的方法,把小于0大于255的都截断,然后再转换成uint8。得到的结果如右图所示。 一段验证性 阅读全文
posted @ 2019-01-19 20:24 sunny,lee 阅读(2291) 评论(0) 推荐(0) 编辑
摘要: 在基于CNN的超分辨率中,经常在最后一层使用stride>1的deconv layer,而这会造成棋盘格噪声。如下图所示 具体产生原因 上面的黑格子是表示原始图像中的某一个像素点,白色的表示转置卷积中的stride,一般是用0去填充。下面一层就是deconv生成的图像。可以看到stride不能整除s 阅读全文
posted @ 2018-12-28 22:09 sunny,lee 阅读(3330) 评论(0) 推荐(0) 编辑
摘要: 2022.5.8最近温习了一下BN,把更白话的一些想法记录下来。 Batch Normalization带来的好处 更容易训练,对初始值更不敏感但是这些是normalization带来的好处,不是batch带来了事实上,batch带来了很多的坏处,最大的坏处就是他的均值和方差在训练的时候是在一个ba 阅读全文
posted @ 2018-12-08 17:43 sunny,lee 阅读(617) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 ffmpeg是一个强大的工具,在工作中各种格式转换,编码,提取视频中的帧需要用到,记录下工作中常用的一些ffmpeg命令,持续更新中... 将输入的infile视频文件通过avc编码成h264的视频流 -i input file -an disable audio -vcodec 指定 阅读全文
posted @ 2018-11-20 21:38 sunny,lee 阅读(22129) 评论(1) 推荐(0) 编辑
摘要: 本文翻译自 https://slhck.info/video/2017/02/24/crf-guide.html ,不当之处,请多指教。 正文 什么是CRF? CRF是264和265中默认的质量/码率控制设置。这个值可以在0到51之间,值越低,质量越好,文件大小越大。在x264上面,一般取值为18- 阅读全文
posted @ 2018-11-18 21:57 sunny,lee 阅读(10465) 评论(0) 推荐(0) 编辑