02 2022 档案
BEP概述
摘要:Byte-Pair-Encoding是用于解决未登录词的一种方法。首先简单提一句什么是未登录词,未登录词可以理解为训练语料库中没有出现的,但是在测试语料库中出现的词。我们在处理NLP任务时,通常会根据语料生成一个词典,把语料中词频大于某个阈值的词放入词典中,而低于该阈值的词统统编码成"#UNK"。这 阅读全文
posted @ 2022-02-28 21:31 啥123 阅读(935) 评论(0) 推荐(0)
论文--大规模情感词典的构建及其在情感分类中的应用
摘要:论文主要基于海量的微博数据,使用简单的文本统计算法,构建了一个十万词语的大规模情感词典。(论文地址:http://jcip.cipsc.org.cn/CN/abstract/abstract2374.shtml#) 情感词典的构建流程如下: 表情符种子获取,利用提前构建好的情感词语种子,在一个较小规 阅读全文
posted @ 2022-02-26 20:54 啥123 阅读(336) 评论(0) 推荐(0)
情感词典和常用显示情感数据集
摘要: 阅读全文
posted @ 2022-02-25 17:18 啥123 阅读(40) 评论(0) 推荐(0)
tensorflow安装无法导入
摘要:1.查看本地安装版本 pip list 记住自己的版本,方便第二步进行卸载 2.卸载本地版本 pip uninstall tensorflow==2.1.0 #我的版本是2.1.0 3.查看是否卸载 pip list 4.安装1.12.0版本 pip install tensorflow==1.12 阅读全文
posted @ 2022-02-24 09:55 啥123 阅读(405) 评论(0) 推荐(0)
transformer模型
摘要:参考博客:https://blog.csdn.net/u012526436/article/details/86295971 讲解非常好! 模型使用 Layer normalization而不使用Batch normalization的原因见之前博客。 网络层数较深的时候会出现网络退化问题,就是层数 阅读全文
posted @ 2022-02-23 10:05 啥123 阅读(1102) 评论(0) 推荐(0)
模型评价指标
摘要:精确率就是指模型所预测出的这类样本中有多少样本是猜对了的。 召回率是指原来真实的这类样本有多少被找出来了。 阅读全文
posted @ 2022-02-08 17:05 啥123 阅读(27) 评论(0) 推荐(0)