摘要:我觉得有不少人会需要tensorflow真正的执行时间和ps,worker之间的通信时间吧,这里是我做的一些尝试,对于执行时间而言,还是比较好得到的,通信时间怎么计算呢? 1. netperf工具 这是我从一篇论文中看到的工具,但是! 这个工具也是算作分布式环境下,测试的一个利器 不过,就我现在的使 阅读全文
posted @ 2020-10-11 16:52 O_din 阅读(167) 评论(0) 推荐(0) 编辑
摘要:本文所有环境均手动装,没有用镜像 1. 准备所有用到的包 python cuda cudnn tensorflow 2. 装python 这里是指原环境为2.7,但是我们要3.6 参考https://www.cnblogs.com/ilovepython/p/11068845.html这个帖子,完美 阅读全文
posted @ 2020-09-22 09:02 O_din 阅读(197) 评论(0) 推荐(0) 编辑
摘要:上面的是问题截图 我的环境:tensorflow 1.5.0 我在确定模型保存以及加载路径后,仍然没有发现问题所在。网上的解决方案也都试了: 1)换成绝对路径 2)保存模型的saver.restore(sess,'./model.ckpt') 3)model.ckpt-0xxx改成了model.ck 阅读全文
posted @ 2020-09-18 22:27 O_din 阅读(875) 评论(0) 推荐(0) 编辑
摘要:1 Introduction 目前分布式学习在资源供应方面,都是依据之前的相似任务进行手动设置,但是对于首次运行的负载而言,只能反复尝试以找到最优的资源配置。 但是反复试错的代价是十分高昂的,每一轮迭代都要花几分钟重建图,而且,确定分配给当前作业多少资源需要提前知道作业的规模特征。 所以现在的资源分 阅读全文
posted @ 2020-04-04 22:44 O_din 阅读(341) 评论(0) 推荐(0) 编辑
摘要:首先mark一下当时问题的截图 提示是所有的TAP-Windows的adapter全都在使用 至于什么是TAP-Windows adapter以及是干嘛用的网上有很多讲解,但是大部分都是在说如何修复,在这个问题下,adapter是不需要被修复的,查看了一下设备管理器: 在适配器上有个感叹号,点开查看 阅读全文
posted @ 2020-03-30 13:12 O_din 阅读(0) 评论(0) 推荐(0) 编辑
摘要:原理性的参见技术博客: 一文读懂生成对抗网络(GANs) 这里只记录下来对设计思路的进一步认知 首先要理解 什么叫最终目标是输出样本以假乱真? 首先输出样本不是真样本容易理解,同时输出样本是假样本,但是这些假样本可以达到判别器无法判断,即真假概率同为0.5的效果 然后训练出来的样本达到真假平衡的效果 阅读全文
posted @ 2020-03-19 20:44 O_din 阅读(264) 评论(0) 推荐(0) 编辑
摘要:1. 基础操作 添加/删除数据库: create database name drop database name 添加/删除数据表: create table name( col_name type, col_name type, col_name type ); drop table name; 阅读全文
posted @ 2020-02-24 16:47 O_din 阅读(68) 评论(0) 推荐(0) 编辑
摘要:0 上手前准备 首先看数据集意义,确定以哪个数据集为基层数据通过添加特征丰富数据,最后形成训练集。 然后看预测结果集的格式,对于二分类问题是形成最终的预测(如0,1)还是预测概率(如5e^-4)。 最重要的是要看手册,避免自身操作带来的失误。 1 数据挖掘基础操作 1.1 查看表 查看表的前五行,方 阅读全文
posted @ 2019-09-28 18:06 O_din 阅读(255) 评论(0) 推荐(0) 编辑
摘要:1、添加权重 2、输出 3、结果集分布 阅读全文
posted @ 2019-09-10 08:30 O_din 阅读(117) 评论(0) 推荐(0) 编辑
摘要:TypeError: write() argument must be str, not list 类型转换:str转list与list转str TypeError: sequence item 0: expected str instance, int found 至此,上述问题解决******* 阅读全文
posted @ 2019-04-17 13:42 O_din 阅读(304) 评论(0) 推荐(0) 编辑