摘要:        
简介 本次作业所用到的数据为Twitter上的推文,训练数据会被打上正面或负面的标签,最终我们要对无标签的句子分类。 带标签的训练数据,中间的+++$+++只是分隔符,共200000条数据。 不带标签的训练数据,共1178614条数据。 测试数据,共200000条数据。 数据处理 读数据 impor    阅读全文
posted @ 2020-10-09 20:47
Kayden_Cheung
阅读(938)
评论(0)
推荐(0)
        
            
        
        
摘要:        
LSTM 参数 input_size:输入维数 hidden_size:输出维数 num_layers:LSTM层数,默认是1 bias:True 或者 False,决定是否使用bias, False则b_h=0. 默认为True batch_first:True 或者 False,因为nn.lst    阅读全文
posted @ 2020-10-09 16:31
Kayden_Cheung
阅读(3851)
评论(0)
推荐(1)
        
            
        
        
摘要:        
在RNN模型的训练过程中,需要用到词嵌入,而torch.nn.Embedding就提供了这样的功能。我们只需要初始化torch.nn.Embedding(n,m),n是单词数,m就是词向量的维度。 一开始embedding是随机的,在训练的时候会自动更新。 举个简单的例子: word1和word2是    阅读全文
posted @ 2020-10-09 15:15
Kayden_Cheung
阅读(1821)
评论(0)
推荐(1)
        

浙公网安备 33010602011771号