随笔分类 - 文本分类

小样本学习（few-shot learning）在文本分类中的应用

摘要：1，概述目前有效的文本分类方法都是建立在具有大量的标签数据下的有监督学习，例如常见的textcnn，textrnn等，但是在很多场景下的文本分类是无法提供这么多训练数据的，比如对话场景下的意图识别，这个时候如果我们还以传统的深度学习模型+softmax的形式来分类的话，是极容易陷入过拟合的状态。因阅读全文

posted @ 2019-08-13 17:38 微笑sun 阅读(20202) 评论(2) 推荐(3)

BERT模型在多类别文本分类时的precision, recall, f1值的计算

摘要：BERT预训练模型在诸多NLP任务中都取得最优的结果。在处理文本分类问题时，即可以直接用BERT模型作为文本分类的模型，也可以将BERT模型的最后层输出的结果作为word embedding导入到我们定制的文本分类模型中（如text-CNN等）。总之现在只要你的计算资源能满足，一般问题都可以用BER 阅读全文

posted @ 2019-01-31 17:50 微笑sun 阅读(13215) 评论(6) 推荐(0)

文本分类实战（十）—— BERT 预训练模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-08 20:24 微笑sun 阅读(102424) 评论(73) 推荐(16)

文本分类实战（九）—— ELMO 预训练模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-07 18:58 微笑sun 阅读(24304) 评论(16) 推荐(2)

少量数据文本分类避免过拟合的方法

摘要：1 概述虽说现在深度学习在文本分类上取得了很大的进步，但是很多时候在工业界没有与之匹配的数据量，在少量数据的情况下，使用深度学习很容易出现过拟合，而此时使用传统的TF-IDF加机器学习又无法取得良好的效果。针对这种情况，我们来看看在使用深度学习时有哪些方法也尽量地避免过拟合。 2 过拟合的处理方法阅读全文

posted @ 2019-01-04 14:34 微笑sun 阅读(3825) 评论(0) 推荐(2)

文本分类实战（八）—— Transformer模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 20:00 微笑sun 阅读(57207) 评论(35) 推荐(4)

文本分类实战（七）—— Adversarial LSTM模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 14:25 微笑sun 阅读(7936) 评论(8) 推荐(1)

文本分类实战（六）—— RCNN模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 14:14 微笑sun 阅读(13876) 评论(1) 推荐(0)

文本分类实战（五）—— Bi-LSTM + Attention模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 14:05 微笑sun 阅读(87643) 评论(32) 推荐(7)

文本分类实战（四）—— Bi-LSTM模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 13:54 微笑sun 阅读(42436) 评论(7) 推荐(2)

文本分类实战（三）—— charCNN模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 11:42 微笑sun 阅读(10839) 评论(7) 推荐(0)

文本分类实战（二）—— textCNN 模型

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 11:07 微笑sun 阅读(44458) 评论(30) 推荐(2)

文本分类实战（一）—— word2vec预训练词向量

摘要：1 大纲概述文本分类这个系列将会有十篇左右，包括基于word2vec预训练的文本分类，与及基于最新的预训练模型（ELMo，BERT等）的文本分类。总共有以下系列： word2vec预训练词向量 textCNN 模型 charCNN 模型 Bi-LSTM 模型 Bi-LSTM + Attention 阅读全文

posted @ 2019-01-02 10:28 微笑sun 阅读(79970) 评论(5) 推荐(8)