摘要: 简介 本次作业所用到的数据为Twitter上的推文,训练数据会被打上正面或负面的标签,最终我们要对无标签的句子分类。 带标签的训练数据,中间的+++$+++只是分隔符,共200000条数据。 不带标签的训练数据,共1178614条数据。 测试数据,共200000条数据。 数据处理 读数据 impor 阅读全文
posted @ 2020-10-09 20:47 Kayden_Cheung 阅读(865) 评论(0) 推荐(0) 编辑
摘要: LSTM 参数 input_size:输入维数 hidden_size:输出维数 num_layers:LSTM层数,默认是1 bias:True 或者 False,决定是否使用bias, False则b_h=0. 默认为True batch_first:True 或者 False,因为nn.lst 阅读全文
posted @ 2020-10-09 16:31 Kayden_Cheung 阅读(3606) 评论(0) 推荐(1) 编辑
摘要: 在RNN模型的训练过程中,需要用到词嵌入,而torch.nn.Embedding就提供了这样的功能。我们只需要初始化torch.nn.Embedding(n,m),n是单词数,m就是词向量的维度。 一开始embedding是随机的,在训练的时候会自动更新。 举个简单的例子: word1和word2是 阅读全文
posted @ 2020-10-09 15:15 Kayden_Cheung 阅读(1663) 评论(0) 推荐(1) 编辑
//目录