03 2020 档案
摘要:1、反转链表 link InvertList(link head){ link pre,phead,temp; phead = head; //将phead指向链表头,做游标使用 pre = NULL; //pre为头指针之前的节点 while(phead != NULL){ temp = pre;
阅读全文
摘要:(引用自:https://zhuanlan.zhihu.com/p/49271699 ,本文作个人学习用) 1 语言模型介绍 什么是语言模型?其实看上面这张PPT上扣下来的图就明白了,为了能够量化地衡量哪个句子更像一句人话,可以设计如上图所示函数,核心函数P的思想是根据句子里面前面的一系列前导单词预
阅读全文
摘要:如何比较文本的相似度? (引用自:https://blog.csdn.net/qq_28031525/article/details/79596376) 度量文本相似度包括如下三种方法: 一是基于关键词匹配的传统方法,如N-gram相似度; tf-idf相似度 二是将文本映射到向量空间,再利用余弦相
阅读全文
摘要:1 半监督方法的定义 2 伪标签的定义 值得注意的是: 测试集的采样比例不能过高,一般都是(0.3 -- 0.5) 一些其他总结的点: 一般分类分类问题属于Low-Density Separation 时,加入伪标签才有用,建议观看李弘毅的视频,讲半监督的部分,举个简单的例子,二分类问题预训练模型对
阅读全文
摘要:1 列出几种文本特征提取算法 答:文档频率、信息增益、互信息、X^2统计、TF-IDF (引用自:https://www.cnblogs.com/jiashun/p/CrossEntropyLoss.html) 信息: 由于概率I 是一个)0至1的值,所以当事件发生的概率越大时,信息量越小。 相对熵
阅读全文
摘要:文本匹配相关方向探讨 转载:https://www.jiqizhixin.com/articles/2019-10-18-14 因为本人毕设做到了和文本匹配相关方向的研究,所以转发此博客探讨文本匹配的方向。 Motivation 前不久小夕在知乎上写了一个回答《NLP有哪些独立研究方向》[1],于是
阅读全文

浙公网安备 33010602011771号