随笔分类 -  机器学习----推荐系统中的NLP

摘要:Precision@K、Recall@K、F1@K、MRR、AP、MAP、CK@K、DCG@K、NDCG@K理解与实例解析, 这篇文章里,作者写的很清楚:https://mp.weixin.qq.com/s/WD8n3Ll5tDgzTMJX7eKLiQ 阅读全文
posted @ 2022-07-27 15:09 浅忆~ 阅读(120) 评论(0) 推荐(2)
摘要:鼠标放在标题,即可打开目录,帮助快速浏览 一、词向量定义 Embedding在数学上表示一个maping, f: X -> Y, 也就是一个function,其中该函数是injective(就是我们所说的单射函数,每个Y只有唯一的X对应,反之亦然)和structure-preserving (结构保 阅读全文
posted @ 2022-07-11 10:53 浅忆~ 阅读(359) 评论(0) 推荐(0)
摘要:引言 早期学者解决问题所运用的是数学概率统计的方法,这些方法在实现前都要经过词特征的构建、特征降维和特征表示;后期由于机器学习的兴起,一开始使用全连接网络模型,它是指在神经网络中每两层之间的所有结点都是相连接的,但在处理图像数据时,全连接网络所需要的参数个数太多,比如处理一张单通道图片,图片大小为2 阅读全文
posted @ 2022-03-19 20:40 浅忆~ 阅读(1006) 评论(0) 推荐(1)
摘要:基于内容的推荐算法: 1、算法原理:从"构造特征"到"判断用户是否喜欢" 2、应用场景:系统向用户特征与他们过去兴趣相似的电影 基于近邻的推荐算法: 1、UserCF算法(用户协同过滤算法) 算法原理:从"构造特征"到"判断用户是否喜欢" 2、ItemCF算法(项目的协同过滤算法) 算法原理:"找到 阅读全文
posted @ 2021-07-27 16:04 浅忆~ 阅读(777) 评论(0) 推荐(0)
摘要:时间衰减函数 阅读全文
posted @ 2021-07-27 15:59 浅忆~ 阅读(4637) 评论(0) 推荐(0)
摘要:文本生成评价指标 ROUGE(Recall-Oriented Understudy for Gisting Evaluation)是一组度量,用于比较自动生成的摘要或翻译与人类生成的参考摘要或翻译之间的相似性。ROUGE与BELU的区别是ROUGE只考虑召回率,即不关心翻译结果是否流畅,只关注翻译是 阅读全文
posted @ 2021-07-25 20:34 浅忆~ 阅读(406) 评论(0) 推荐(0)
摘要:https://www.zhihu.com/question/44832436?sort=created https://blog.csdn.net/Ding_xiaofei/article/details/80171474?ops_request_misc=%257B%2522request%25 阅读全文
posted @ 2021-04-29 15:48 浅忆~ 阅读(68) 评论(0) 推荐(0)
摘要:transformers较为知名的应用是BERT,Transformers可以看成是seq2seq model,特点在于this model leverages mass “self-attention” layers,seq2seq在What-is-seq2seq篇已经解释过,接下来将对`self 阅读全文
posted @ 2020-12-21 18:55 浅忆~ 阅读(132) 评论(0) 推荐(0)
摘要:一、数据预处理 sentence sentences是训练所需材料,可通过两种格式载入:1、文本格式:将每篇文章 分词去停用词后,用空格分割,将其存入txt文本中(每一行一篇文章) 2、list嵌套格式将每篇文章 分词去停用词后,存入list中。即[ [第一篇文章分词结果] , [第二篇文章分词结果 阅读全文
posted @ 2020-12-20 12:50 浅忆~ 阅读(974) 评论(0) 推荐(0)
摘要:--- --- 阅读全文
posted @ 2020-08-22 09:16 浅忆~ 阅读(103) 评论(0) 推荐(0)
摘要:详细代码和数据(part02/python文本分析/news_sougou)可以查看这个:https://github.com/HappyZXY/machineLearning 数据源: http://www.sogou.com/labs/resource/ca.php 来自若干新闻站点2012年6 阅读全文
posted @ 2019-07-02 15:32 浅忆~ 阅读(1841) 评论(0) 推荐(0)