随笔分类 - NLP
摘要:大纲: 1、介绍2、数据标注,数据输入格式3、3种文本多标签分类的方法4、损失函数、概率、预测结果 一、文本分类介绍 首先,我介绍下文本多分类和文本多标签分类的的区别。 1、Multi-Class:多分类/多元分类(二分类、三分类、多分类等) 二分类:判断邮件属于哪个类别,垃圾或者非垃圾 多分类:判
阅读全文
摘要:NLP问题,大都至少是个统计类问题,对整个数据集进行分析,然后给出概率最大的结果,无论是基于概率的浅层学习,还是使用了深度学习都是如此,而少了可供添加和修改的特征,此时如果出现比较关键的bad case,就并不好干预,而且在干预的同时还需要考虑尽可能不产生新的bad case,这样一来,要处理这些b
阅读全文
摘要:说到softmax和sigmoid二者差别,就得说说二者分别都是什么。其实很简单,网上有数以千计的优质博文去给你讲明白,我只想用我的理解来简单阐述一下: sigmoid函数针对两点分布提出。神经网络的输出经过它的转换,可以将数值压缩到(0,1)之间,得到的结果可以理解成“分类成目标类别的概率P”。而
阅读全文
摘要:准备1、先说一下什么是logit,logit函数定义为: 是一种将取值范围在[0,1]内的概率映射到实数域[-inf,inf]的函数,如果p=0.5,函数值为0;p<0.5,函数值为负;p>0.5,函数值为正。 相对地,softmax和sigmoid则都是将[-inf,inf]映射到[0,1]的函数
阅读全文

浙公网安备 33010602011771号