TF2基础知识

一：TF2

1. Eager Execution（即时执行模式）

TensorFlow 2 带来的最大改变之一是将 1.x 的 Graph Execution（图与会话机制）更改为 Eager Execution（即时执行模式，也称动态图机制）。

在 1.x 版本中，低级别 TensorFlow API 首先需要定义数据流图，然后再创建 TensorFlow 会话，这一点在 2.0 中被完全舍弃。TensorFlow 2 中的 Eager Execution 是一种命令式编程环境，可立即评估操作，无需构建图。

如果想要在1.X版本中，可以调 tf.enable_eager_execution() 函数开启即时执行模式。

TensorFlow 2 中，即时执行模式将成为默认模式（不过若要关闭即时执行模式，则需调用 tf.compat.v1.disable_eager_execution() 函数）。

1.x 版本的 TensorFlow：

一个加法运算过程十分复杂。我们需要初始化全局变量 → 建立会话 → 执行计算，最终才能打印出张量的运算结果。

init_op = tf.global_variables_initializer()  # 初始化全局变量
with tf.Session() as sess:  # 启动会话
    sess.run(init_op)
    print(sess.run(c + c))  # 执行计算

Eager Execution 带来的好处显而易见，其进一步降低了 TensorFlow 的入门门槛。之前的 Graph Execution 模式，实际上让很多人在入门时都很郁闷，因为完全不符合正常思维习惯

2. 自动求导机制

2.1 微分概念：

微分是对局部变化率的一种线性描述。虽然微分和导数是两种不同的概念。

但是对一元函数来说，可微与可导是完全等价的。

如果你熟悉神经网络的搭建过程，应该明白梯度的重要性。而对于复杂函数的微分过程是及其麻烦的，为了提高应用效率，大部分深度学习框架都有自动微分机制。

TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。

二：Tensorflow基础

1. 张量(Tensor)

1.1 概念

一维数组称之为向量，二维数组称之为矩阵。

张量可以看作N 维数组，变量名为Tensor

如果现在重新描述向量和矩阵，就是：一阶张量为向量，二阶张量为矩阵。当然，零阶张量也就是标量，而更重要的是 N 阶张量，也就是 N 维数组。

1.2 张量的定义

每一个 Tensor 都具备两个基础属性：数据类型（默认：float32）和形状。

TensorFlow 通过三种符号约定来描述张量维度：阶，形状，维数

阶形状维度

0 [] 0-D

1 [D0] 1-D

2 [D0, D1] 2-D

1.3 创建张量

常用数据类型
- tf.int： tf.int 64
- tf.float ： tf.float 32、tf.float 64
- tf.bool： [true]
- tf.string： "Hello word"

创建张量

# 定义一个np数组
import numpy as np

array1 = np.arange(15).reshape(3, 5)
array1

tf.constant ()

Tensor常量，需要指定初始值，定义不变化的张量

# tf.constant(value, dtype=None, shape=None, name='Const')
tf.constant([1, 5], dtype=tf.int32)

tf.Variable()

Tensor变量，需要指定初始值，常用于定义可变参数。会将变量标记为"可训练"，被标记的变量会在反向传播中记录梯度信息，例如神经网络的权重训练。
```
# tf.Variable(value, dtype=None, shape=None, name='Const')
tf.Variable([1, 5], dtype=tf.int32)
```

tf.convert_to_tensor()

将numpy格式的数据转换成Tensor。（tf.constant也可实现）

# tf.convert_to_tensor(value, dtype=None, dtype_hint=None, name=None)
Tensor31 = tf.convert_to_tensor(ndarray1, dtype=tf.int64)
print(Tensor31)
# 等价于下面这句
Tensor32 = tf.constant(ndarray1, dtype=tf.int64)
print(Tensor32)

Tensor的属性
- 形状 shape：
```
Tensor31.shape
```
- 数据类型 dtype：
```
Tensor31.dtype
```
- 对应的 NumPy 数组：
```
Tensor31.numpy()
```
新建特殊常量张量的方法
- tf.zeros ：新建指定形状且全为 0 的常量 Tensor
- tf.zeros_like ：参考某个Tensor的形状，新建全为 0 的常量 Tensor
- tf.ones ：新建指定形状且全为 1 的常量 Tensor
- tf.ones_like ：参考某种形状，新建全为 1 的常量 Tensor
- tf.fill ：新建一个指定形状且全为某个标量值的常量 Tensor
```
# tf.zeros(shape, dtype=tf.float32, name=None)
Tensor21 = tf.zeros([3, 3])
# tf.zeros_like(input, dtype=None, name=None)
Tensor22 = tf.zeros_like(Tensor21) # 输入为Tensor， 意为与Tensor形状一致，且值全为0的常量Tensor
# tf.fill(dims, value, name=None)
Tensor23 = tf.fill([3, 3], 2)

print(Tensor21)
print(Tensor22)
print(Tensor23)
```

生成随机张量：

均匀分布的随机数

# 均匀分布在区间[minval, maxval]的随机数
tf.random.uniform(shape=[2,3], minval=0, maxval=10)

生成正态分布的随机数

# 生成正态分布的随机数。默认均值为0、标准差为1
tf.random.normal(shape=[2,3], mean=10, stddev=1)

生成截断式正态分布的随机数

# 生成截断式正态分布的随机数
tf.random.truncated_normal(shape=[2,3], mean=10, stddev=1)
# 如果生成的数据在(μ-2δ, μ+2δ)之外，则重新进行生成，保证生成值在均值附近。
# δ：均值，δ：标准差

常用方法

强制类型转换并不会改变原来的类型，而是返回一个新的张量

# tf.cast(x, dtype, name=None)
print(Tensor41.dtype)
ts1 = tf.cast(Tensor41, dtype=tf.int32)

print(Tensor41.dtype)
print(ts1.dtype)

求张量维度上元素的最大/小值

# tf.reduce_min(input_tensor, axis=None, keepdims=False, name=None)
print(Tensor41)

print(tf.reduce_min(Tensor41))
# tf.reduce_max(input_tensor, axis=None, keepdims=False, name=None)
print(tf.reduce_max(Tensor41))

其他方法
- tf.linspace()
  
  创建一个等间隔序列。
- tf.range()
  
  创建一个数字序列。
```
# tf.linspace(start, stop, num, name=None)
tf.linspace(2.0, 6.0, 3)
```

可以看到返回类型为浮点型

注意：TensorFlow 的大多数 API 函数会根据输入的值自动推断张量中元素的类型（一般默认为 tf.float32 ）。不过你也可以通过加入 dtype 参数来自行指定类型

2. 操作(operation)

TensorFlow 里有大量的操作（Operation），使得我们可以将已有的张量进行运算后得到新的张量。

定义如下Tensor

Tensor41 = tf.constant(tf.linspace(1.0, 6.0, 6), shape=(2,3))
Tensor42 = tf.constant(tf.linspace(1.0, 9.0, 9), shape=(3,3))
Tensor43 = tf.constant(tf.linspace(7.0, 12.0, 6), shape=(2,3))
print(Tensor41)
print(Tensor42)
print(Tensor43)

2.1 四则运算

# add
print(tf.add(Tensor43, Tensor41))

两个矩阵中对应元素各自相乘时，要求两个张量维度相同。

# subtract
print(tf.subtract(Tensor43, Tensor41))
# multiply
print("数值 x 矩阵\n", tf.multiply(10, Tensor41))
print("矩阵 x 矩阵\n", tf.multiply(Tensor43, Tensor41))

2.2 平方、次方、开方

# 定义张量
Tensor5 = tf.fill([3,3], 3)

平方

# 平方。tf.square(x, name=None)
print(tf.square(Tensor5))
# 等价于
print(tf.multiply(Tensor5, Tensor5))
print(tf.pow(Tensor5, 2))

n次方

# n次方。tf.pow(x, y, name=None)
print(tf.pow(Tensor5, 2))

开平方

# 开平方。tf.sqrt(x, name=None)
Tensor51 = tf.fill([3,3], 9.0)

print(Tensor51)
print(tf.sqrt(Tensor51))

2.3 点乘

# matmul
Tensor4_mat = tf.matmul(Tensor41, Tensor42)
print(Tensor4_mul)

2.4 矩阵转置

Tensor41 = tf.constant(line[0:5], dtype=float, shape=[1, 5])
# Tensor42 = tf.linalg.matrix_transpose(Tensor41) # 报错
Tensor42 = tf.transpose(Tensor41)
print("矩阵转置\n")
print(Tensor41)
print(Tensor42)

这些常用 API 都能在 NumPy 中找到对应的方法，这也就是课程需要你预先熟悉 NumPy 的原因。所以说，你可以把 TensorFlow 理解成为 TensorFlow 式的 NumPy + 为搭建神经网络而生的 API。

3. 常用函数

3.1 特征--标签配对

神经网络在训练时，是把输入特征和标签配对后，再喂入网络的。我们可以用tf.data.Dataset.from_tensor_slices 进行配对。

参数除了传入Tensor之外，还可以传入numpy数组。

# tf.data.Dataset.from_tensor_slices( (tensor_label, tensor_feature) )。

X = tf.constant([12,21,22,34])
y = tf.constant([0,1,1,0])
dataset = tf.data.Dataset.from_tensor_slices((X, y))
print(dataset)

for e in dataset:
    print(e)

3.2 自动求导

微分概念：

微分是对局部变化率的一种线性描述。虽然微分和导数是两种不同的概念。

但是对一元函数来说，可微与可导是完全等价的。

TensorFlow 中，你可以使用 tf.GradientTape 跟踪全部运算过程，以便在必要的时候计算梯度。然后用tf.GradientTape().gradient 进行求导计算。

with tf.GradientTape() as tape: # 追踪梯度
    w = tf.Variable([2.0])
    loss = tf.pow(w, 3)

# loss 对 w 求导
grad = tape.gradient(loss, w) 
# 求导结果为：3*w*w => 12
grad
# 输出grap，与我们计算的值一致。

3.3 枚举函数

enumerate 函数可将一个可遍历的数据对象(如列表、元组或字符串)

组合为索引序列，同时列出数据和数据下标，一般用在 for 循环当中。

lst = ['aa', 'bb', 'cc']
for index, value in enumerate(lst):
    print("%s : %s" %(index,value))

3.4 独热编码

# 如鸢尾花数据，三分类。
y = tf.constant([1,1,0,2])
classes = 3
y_one_hot = tf.one_hot(y, classes)
print(y_one_hot)

前后对比：

0 ==> 1 0 0

1 ==> 0 1 0

2 ==> 0 0 1

可知，独热编码转换过程是：

以[0, x-1]区间内的数字n为例子（x为分类的数量）：

将每一个数转换成长度为x位、值全为 0 的二进制数
将第n位的 0 转换成1。(位数从0到x-1)

3.5 归一化指数函数

正向传播：https://www.bilibili.com/video/BV1bx411M7Zx

softmax函数可以使n分类的n个输出y0,y1...中，各个输出的概率值。

且这些概率值的和为1。

3.6 自减函数

赋值操作，更新参数的值并返回。
调用assign_sub前，先用 tf.Variable 定义变量w为可训练（可自更新）。

w.assign_sub(delta, use_locking=None, name=None, read_value=True)

w = tf.Variable(tf.constant(4.0))
w.assign_sub(1)
# 相当于： w -= 1
w.numpy()

3.7 最大值索引

返回张量沿指定轴方向，最大值的索引

tf.argmax(张量名, axis=操作轴)

4. 常用模块

tf.：包含了张量定义，变换等常用函数和类。
tf.data：输入数据处理模块，提供了像 tf.data.Dataset 等类用于封装输入数据，指定批量大小等。
tf.image：图像处理模块，提供了像图像裁剪，变换，编码，解码等类。
tf.keras：原 Keras 框架高阶 API。包含原 tf.layers 中高阶神经网络层。
tf.linalg：线性代数模块，提供了大量线性代数计算方法和类。
tf.losses：损失函数模块，用于方便神经网络定义损失函数。
tf.math：数学计算模块，提供了大量数学计算函数。
tf.saved_model：模型保存模块，可用于模型的保存和恢复。
tf.train：提供用于训练的组件，例如优化器，学习率衰减策略等。
tf.nn：提供用于构建神经网络的底层函数，以帮助实现深度神经网络各类功能层。
tf.estimator：高阶 API，提供了预创建的 Estimator 或自定义组件。

posted @ 2020-11-04 21:41 linlk 阅读(264) 评论(0) 收藏举报

刷新页面返回顶部

linlk