tensorflow经验
1
分布式中worker报错 tensorflow.python.framework.errors_impl.UnavailableError: Transport closed 并无其他报错细节,可尝试上调ps的个数以解决。
2
利用tf.feature_column里面各种特征转换的方法,可输入到tf.feature_column.input_layer 或者 tf.feature_column.linear_model,获得转换好的tensor
3
with tf.Session() as sess后,default_graph就被锁死了,不能对tensor数量进行变更操作
4
运行TF分布式框架时,因为没有明确的标志表明分布式框架已启动。需要查看日志中grpc的相关信息,来确定框架是否启用。
5
TF分布式框架,仅chief进行checkpoint的记录。其余的worker不记录checkpoiint

浙公网安备 33010602011771号