07 2019 档案

摘要:自然语言处理之LSA LSA(Latent Semantic Analysis), 潜在语义分析。试图利用文档中隐藏的潜在的概念来进行文档分析与检索,能够达到比直接的关键词匹配获得更好的效果。 LSA的核心思想 假设有 nn 篇文档,这些文档中的单词总数为 mm (可以先进行分词、去词根、去停止词操 阅读全文
posted @ 2019-07-29 21:14 虾野百鹤 阅读(1866) 评论(0) 推荐(2)
摘要:BERT模型是什么 BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,因为decoder是不能获要预测的信息的。模型的主要创新点都在pre train方法上,即用了Masked 阅读全文
posted @ 2019-07-15 21:11 虾野百鹤 阅读(2610) 评论(0) 推荐(1)
摘要:迁移学习的定义 如果用一种图来表示迁移学习的思想的话,那就是: Knowledge[Not supported by viewer]Learning System[Not supported by viewer] 一些基本的标签以及数据集之间的关系就不做过多的叙述了,我们用 $\mathcal{D} 阅读全文
posted @ 2019-07-08 21:13 虾野百鹤 阅读(1105) 评论(0) 推荐(1)
摘要:感觉大佬的代码写的就是好,在处理数据的方面,首先定义一个 提取特征的类, ,然后每一种方法对这个类进行重构,这个类主要结构就是: 接下来看如何具体的从统计的角度与 NLP 的角度处理数据 统计学的角度处理数据的方法 从统计学的角度考虑主要是单词的频率,数据的次数等等,这里考虑的问题很多,总结来说就是 阅读全文
posted @ 2019-07-01 17:16 虾野百鹤 阅读(752) 评论(0) 推荐(1)