mantch - 博客园

【Model Log】模型评估指标可视化，自动画Loss、Accuracy曲线图工具，无需人工参与!

摘要： Model Log 是一款基于 Python3 的轻量级机器学习(Machine Learning)、深度学习(Deep Learning)模型训练评估指标可视化工具，与 TensorFlow、Pytorch、PaddlePaddle结合使用，可以记录模型训练过程当中的**超参数、Loss、Accuracy、Precision、F1值等，并以曲线图的形式进行展现对比**，轻松三步即可实现。阅读全文

posted @ 2020-06-27 21:32 mantch 阅读(1700) 评论(0) 推荐(0)

BERT实现QA中的问句语义相似度计算

摘要：有一个这样的场景，QA对话系统，希望能够在问答库中找到与用户问题相似的句子对，然后把答案返回给用户。这篇就是要解决这个问题的。阅读全文

posted @ 2020-03-14 21:52 mantch 阅读(3349) 评论(0) 推荐(0)

13.深度学习(词嵌入)与自然语言处理--HanLP实现

摘要：深度学习(Deep Leaming, DL )属于表示学习( Representation Learning )的范畴，指的是利用具有一定“深度”的模型来自动学习事物的向量表示(vectorial rpresenation)的一种学习范式。目前，深度学习所采用的模型主要是层数在一层以上的神经网络。 ———————————————— 版权声明：本文为CSDN博主「mantchs」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_41510260/article/details/104402475 阅读全文

posted @ 2020-02-19 22:49 mantch 阅读(2606) 评论(2) 推荐(0)

《自然语言处理入门》12.依存句法分析--提取用户评论

摘要：语法分析(syntactic parsing )是自然语言处理中一个重要的任务，其目标是分析句子的语法结构并将其表示为容易理解的结构(通常是树形结构)。同时，语法分析也是所有工具性NLP任务中较为高级、较为复杂的一种任务。通过掌握语法分析的原理、实现和应用，我们将在NLP工程师之路上跨越一道分水岭。本章将会介绍短语结构树和依存句法树两种语法形式，并且着重介绍依存句法分析的原理和实现。 ———————————————— 版权声明：本文为CSDN博主「mantchs」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_41510260/article/details/104381546 阅读全文

posted @ 2020-02-18 20:12 mantch 阅读(7788) 评论(0) 推荐(4)

10.HanLP实现k均值--文本聚类

摘要： **聚类**(cluster analysis )指的是将给定对象的集合划分为不同子集的过程，目标是使得每个子集内部的元素尽量相似，不同子集间的元素尽量不相似。这些子集又被称为**簇**(cluster),一般没有交集。阅读全文

posted @ 2020-02-14 13:43 mantch 阅读(2646) 评论(0) 推荐(0)

9. HanLP《自然语言处理入门》笔记--9.关键词、关键句和短语提取

摘要：信息抽取是一个宽泛的概念，指的是从非结构化文本中提取结构化信息的一类技术。这类技术依然分为基于规则的正则匹配、有监督学习和无监督学习等各种实现方法。我们将使用一些简单实用的无监督学习方法。由于不需要标注语料库，所以可以利用海量的非结构化文本。阅读全文

posted @ 2020-02-13 18:42 mantch 阅读(3586) 评论(1) 推荐(1)

8.HanLP实现--命名实体识别

摘要：识别出句子中命名实体的边界与类别的任务称为命名实体识别。由于上述难点，命名实体识别也是一个统计为主、规则为辅的任务。对于规则性较强的命名实体，比如网址、E-mail、IBSN、商品编号等，完全可以通过正则表达式处理，未匹配上的片段交给统计模型处理。阅读全文

posted @ 2020-02-12 18:43 mantch 阅读(6671) 评论(0) 推荐(2)

隐马尔可夫(HMM)/感知机/条件随机场(CRF)----词性标注

摘要：在语言学上，词性(Par-Of-Speech, Pos )指的是单词的语法分类，也称为词类。同一个类别的词语具有相似的语法性质，所有词性的集合称为词性标注集。不同的语料库采用了不同的词性标注集，一般都含有形容词、动词、名词等常见词性。下图就是HanLP输出的一个含有词性的结构化句子。 ———————————————— 版权声明：本文为CSDN博主「mantchs」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_41510260/article/details/104261508 阅读全文

posted @ 2020-02-11 12:56 mantch 阅读(1590) 评论(0) 推荐(1)

HanLP《自然语言处理入门》笔记--6.条件随机场与序列标注

摘要：本章介绍一种新的序列标注模型条件随机场。这种模型与感知机同属结构化学习大家族，但性能比感知机还要强大。为了厘清该模型的来龙去脉，我们先对机器学习模型做番柿理。然后结合代码介绍条件随机场理论，探究它与结构化感知机的异同。阅读全文

posted @ 2020-02-10 18:42 mantch 阅读(1204) 评论(0) 推荐(2)

HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注

摘要：本章将深人讲解感知机算法的原理，以及在分类和序列标注上的应用。在序列标注应用部分，我们将实现基于感知机的中文分词器。由于感知机序列标注基于分类，并且分类问题更简单，所以我们先学习分类问题。阅读全文

posted @ 2020-02-09 12:51 mantch 阅读(1378) 评论(0) 推荐(1)

导航

2020年6月27日

2020年3月14日

2020年2月19日

2020年2月18日

2020年2月14日

2020年2月13日

2020年2月12日

2020年2月11日

2020年2月10日

2020年2月9日


博客园 © 2004-2026 浙公网安备 33010602011771号浙ICP备2021040463号-3