双向 LSTM
双向 LSTM(Bidirectional LSTM,BiLSTM)是一种特殊的 LSTM 结构,它同时处理序列的正向和反向信息。这意味着对于给定的时间步,双向 LSTM 不仅考虑了之前的时间步的信息(像标准的单向 LSTM 一样),还考虑了未来时间步的信息。这使得 BiLSTM 在处理自然语言处理任务、语音识别和其他需要理解上下文的任务时非常有用。
class BiLSTMModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers, output_size, bidirectional=True):
super(BiLSTMModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.bidirectional = bidirectional
self.num_directions = 2 if bidirectional else 1
# 定义双向LSTM层
self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True, bidirectional=bidirectional)
# 全连接层用于输出预测,注意输入大小为hidden_size * num_directions
self.fc = nn.Linear(hidden_size * self.num_directions, output_size)
# 后面省略了forward方法