tensorflow经验

1

分布式中worker报错 tensorflow.python.framework.errors_impl.UnavailableError: Transport closed 并无其他报错细节,可尝试上调ps的个数以解决。

利用tf.feature_column里面各种特征转换的方法,可输入到tf.feature_column.input_layer 或者 tf.feature_column.linear_model,获得转换好的tensor

3

with tf.Session() as sess后,default_graph就被锁死了,不能对tensor数量进行变更操作

运行TF分布式框架时,因为没有明确的标志表明分布式框架已启动。需要查看日志中grpc的相关信息,来确定框架是否启用。

TF分布式框架,仅chief进行checkpoint的记录。其余的worker不记录checkpoiint

posted @ 2018-02-28 19:35  JimTheMan  阅读(206)  评论(0)    收藏  举报