深度学习理论
摘要:前段时间,跟部门同事分享了深度学习相关的一些理论基础,在此记录一下。仅供后续学习和复习。 目录 1、背景及现状 2、Embeding 3、DNN 4、CNN 5、RNN(LSTM) 6、应用(结合自身的应用案例) (1)情感分析/类目预测(文本分类) (2)NER/POS TAGGING (标注、命
阅读全文
交叉熵
摘要:1、交叉熵的定义: 在信息论中,交叉熵是表示两个概率分布p,q,其中p表示真实分布,q表示非真实分布,在相同的一组事件中,其中,用非真实分布q来表示某个事件发生所需要的平均比特数。从这个定义中,我们很难理解交叉熵的定义。下面举个例子来描述一下: 假设现在有一个样本集中两个概率分布p,q,其中p为真实
阅读全文
语言模型(N-Gram)
摘要:问题描述:由于公司业务产品中,需要用户自己填写公司名称,而这个公司名称存在大量的乱填现象,因此需要对其做一些归一化的问题。在这基础上,能延伸出一个预测用户填写的公司名是否有效的模型出来。 目标:问题提出来了,就是想找到一种办法来预测用户填写的公司名是否有效? 问题分析:要想预测用户填写的公司名称是否
阅读全文
NLPIR(ICTCLAS)分析包的使用记录
摘要:前段时间使用了HanLP一个纯JAVA分词工具包,后来老大说分词效果不是很好,需要换一个分词工具。于是推荐了一个分词工具——NLPIR,它是中科院XXX研发的一个分词工具。这个分词工具只用C/C++写的,但是它提供了JAVA,C#等调用接口。于是我希望是的通过java来调用。使用java调用C/C+
阅读全文