一、TensorFlow初探


import tensorflow as tf

a = tf.constant([1.0, 2.0], name='a', dtype=tf.float32)  # 定义常量向量
b = tf.constant([2.0, 3.0], name='b')
result = a + b  # 向量相加
print(result)

# 先生成一个会话,通过该会话来计算结果
# sess = tf.Session()
sess = tf.InteractiveSession()  # 自动将生成的会话注册为默认会话
print(sess.run(result))
print(result.eval(session=sess))
sess.close()  # 关闭会话,释放资源

计算模型

  • TensorFlow中的所有计算都会被转化为计算图上的节点。
  • 而节点之间的边描述了计算之间的依赖关系。
  • 在TensorFlow中,张量可以被简单地理解为多维数组。
  • TensorFlow是一个通过计算图的形式来表述计算的编程系统。
g1 = tf.Graph()  # 生成新的计算图
with g1.as_default():
    # 在计算图g1中定义变量'v',并设置初始值为0
    v = tf.get_variable("v", initializer=tf.zeros(shape=[1]))
    
# 在计算图g1中读取变量'v'的值
with tf.Session(graph=g1) as sess:  # 通过上下文管理器来使用会话
    tf.global_variables_initializer().run()
    with tf.variable_scope('', reuse=True):
        print(sess.run(tf.get_variable('v')))

数据模型

  • 在张量中,并没有真正保存数字,它保存的是如何得到这些数字的计算过程。
  • 一个张量中主要保存了三个属性:名字、维度、类型。
  • 张量的命名可通过"node:src_output"的形式给出。其中,node为节点名称,src_output表示当前张量来自节点的第几个输出。
  • TensorFlow支持的类型主要包括:tf.float32, tf.float64, tf.int8, tf.int16, tf.int32, tf.int64, tf.uint8, tf.bool, tf.complex64, tf.complex128

运行模型

config = tf.ConfigProto(allow_soft_placement=True, log_device_placement=True)
sess1 = tf.InteractiveSession(config=config)
sess2 = tf.Session(config=config)

TensorFlow及神经网络

神经网络解决分类问题的主要步骤:

  • 提取问题中实体的特征向量作为神经网络的输入。
  • 定义神经网络的结构,并定义如何从神经网络的输入得到输出。
  • 通过训练数据来调整神经网络中参数的取值,这就是训练神经网络的过程。
  • 使用训练好的神经网络来预测未知的数据。

全连接神经网络:相邻两层之间任意两个节点之间都有连接。

TensorFlow支持的随机数生成函数:

  • tf.random_normal:正态分布。
  • tf.truncated_normal:正态分布,但若随机值偏离平均值超过2个标准差,将被重新随机。
  • tf.random_uniform:平均分布。
  • tf.random_gamma:Gamma分布。

TensorFlow常数生成函数:

  • tf.zeros([2,3], int32):产生全0的数组。
  • tf.ones([2,3], int32):产生全1的数组。
  • tf.fill([2,3], 9):产生一个全部为给定数字的组合。
  • tf.constant([1,2,3):产生一个给定值的常量。
# 声明一个2*3的矩阵变量,并赋予均值为0,标准差为2的随机数
weigths = tf.Variable(tf.random_normal([2, 3], mean=0, stddev=2))
biases = tf.Variable(tf.zeros([3]))
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))  # 该运算的输出结果即为张量
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
x = tf.constant([[0.7, 0.9]])  # 1*2的矩阵

a = tf.matmul(x, w1)  # 矩阵乘法
y = tf.matmul(a, w2)

with tf.Session() as sess:
    # sess.run(w1.initializer)  # 逐个初始化变量
    # sess.run(w2.initializer)
    # 初始化所有变量
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    print(sess.run(y))
    print(tf.all_variables)
  • tf.all_variables:可拿到当前计算图上所有的变量。
  • tf.trainable_variables:得到所有需要优化的参数。
  • 变量的类型是不可改变的。
  • 维度在程序运行中是有可能改变的,需通过设置参数validate_shape=False
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1)) 
w2 = tf.Variable(tf.random_normal([2, 2], stddev=1, seed=1))

# tf.assign(w1, w2)  # wrong
tf.assign(w1, w2, validate_shape=False)
# 使用placeholder实现前向传播算法
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

# 输入为n*2矩阵,前向传播结果为n*1的矩阵
# placeholder中数据的维度信息可以根据提供的数据推导得出,所有不一定要给出
x = tf.placeholder(tf.float32, shape=(3, 2), name='input') 
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

sess = tf.Session()
init_op = tf.global_variables_initializer()
sess.run(init_op)

# print(sess.run(y))  # 某个需要的placeholder没有被指定取值,报错
print(sess.run(y, feed_dict={x: [[0.7, 0.9], [0.1, 0.4], [0.5, 0.8]]}))  # 指定x的取值
from numpy.random import RandomState

batch_size = 8

w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

# 定义损失函数和反向传播的算法
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

# 通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]

# 创建会话
with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    print(sess.run(w1))
    print(sess.run(w2))
    
    STEPS = 5000  # 训练的轮数
    for i in range(STEPS):
        # 每次选取batch_size个样本进行训练
        start = (i * batch_size) % dataset_size
        end = min(start+batch_size, dataset_size)
        # 根据样本训练神经网络并更新参数
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        
        if i % 1000 == 0:
            # 每个一定轮数,计算在所有数据上的交叉熵
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y})
            print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy))
            
    print(sess.run(w1))
    print(sess.run(w2))
posted @ 2018-10-18 10:16  pestle  阅读(175)  评论(0编辑  收藏  举报