07 2019 档案
摘要:自然语言处理之LSA LSA(Latent Semantic Analysis), 潜在语义分析。试图利用文档中隐藏的潜在的概念来进行文档分析与检索,能够达到比直接的关键词匹配获得更好的效果。 LSA的核心思想 假设有 nn 篇文档,这些文档中的单词总数为 mm (可以先进行分词、去词根、去停止词操
阅读全文
摘要:BERT模型是什么 BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,因为decoder是不能获要预测的信息的。模型的主要创新点都在pre train方法上,即用了Masked
阅读全文
摘要:迁移学习的定义 如果用一种图来表示迁移学习的思想的话,那就是: Knowledge[Not supported by viewer]Learning System[Not supported by viewer] 一些基本的标签以及数据集之间的关系就不做过多的叙述了,我们用 $\mathcal{D}
阅读全文
摘要:感觉大佬的代码写的就是好,在处理数据的方面,首先定义一个 提取特征的类, ,然后每一种方法对这个类进行重构,这个类主要结构就是: 接下来看如何具体的从统计的角度与 NLP 的角度处理数据 统计学的角度处理数据的方法 从统计学的角度考虑主要是单词的频率,数据的次数等等,这里考虑的问题很多,总结来说就是
阅读全文

浙公网安备 33010602011771号