BEP概述
    
            
摘要:Byte-Pair-Encoding是用于解决未登录词的一种方法。首先简单提一句什么是未登录词,未登录词可以理解为训练语料库中没有出现的,但是在测试语料库中出现的词。我们在处理NLP任务时,通常会根据语料生成一个词典,把语料中词频大于某个阈值的词放入词典中,而低于该阈值的词统统编码成"#UNK"。这
        
阅读全文
                posted @ 
2022-02-28 21:31 
啥123
        
阅读(935) 
         
        推荐(0)     
             
            
            
    论文--大规模情感词典的构建及其在情感分类中的应用
    
            
摘要:论文主要基于海量的微博数据,使用简单的文本统计算法,构建了一个十万词语的大规模情感词典。(论文地址:http://jcip.cipsc.org.cn/CN/abstract/abstract2374.shtml#) 情感词典的构建流程如下: 表情符种子获取,利用提前构建好的情感词语种子,在一个较小规
        
阅读全文
                posted @ 
2022-02-26 20:54 
啥123
        
阅读(336) 
         
        推荐(0)     
             
            
            
    tensorflow安装无法导入
    
            
摘要:1.查看本地安装版本 pip list 记住自己的版本,方便第二步进行卸载 2.卸载本地版本 pip uninstall tensorflow==2.1.0 #我的版本是2.1.0 3.查看是否卸载 pip list 4.安装1.12.0版本 pip install tensorflow==1.12
        
阅读全文
                posted @ 
2022-02-24 09:55 
啥123
        
阅读(405) 
         
        推荐(0)     
             
            
            
    transformer模型
    
            
摘要:参考博客:https://blog.csdn.net/u012526436/article/details/86295971 讲解非常好! 模型使用 Layer normalization而不使用Batch normalization的原因见之前博客。 网络层数较深的时候会出现网络退化问题,就是层数
        
阅读全文
                posted @ 
2022-02-23 10:05 
啥123
        
阅读(1102) 
         
        推荐(0)     
             
            
            
    模型评价指标
    
            
摘要:精确率就是指模型所预测出的这类样本中有多少样本是猜对了的。 召回率是指原来真实的这类样本有多少被找出来了。
        
阅读全文
                posted @ 
2022-02-08 17:05 
啥123
        
阅读(27) 
         
        推荐(0)