life‘s_a_struggle

导航

2021年5月13日 #

word2vec by Goggle

摘要: word2vec 14年被谷歌搞出来的,社交领域运用十分广泛,并很快被除了文本中之外的其他邻域运用。 首先,了解什么是语言模型: 判断(计算)一句话合理的概率 用周边词预测一个位置出现词的概率(类似于完形填空) 一、模型构建: step1 : 假设我们有一个sentence:w1, w2, w3, 阅读全文

posted @ 2021-05-13 16:20 life‘s_a_struggle 阅读(55) 评论(0) 推荐(0) 编辑

NLP 之 发展

摘要: NLP(Nature Language Processing) 中文自动分词(Chinese word segmentation) 词性标注(Part-of-speech tagging) 句法分析(Parsing) 自然语言生成(Natural language generation) 文本分类( 阅读全文

posted @ 2021-05-13 14:06 life‘s_a_struggle 阅读(46) 评论(0) 推荐(0) 编辑

3.推荐系统 之 内容理解

摘要: 推荐系统 之 内容理解 提取内容关键词 对内容品类进行提取 关键词分两种: 外显关键词,要求质量高,用户看的到的Tag 隐形关键词,要求低一些,用户看不到,用于分发。 一、关键词提取 可以从标题中提取,也可从正文中提取。 方法:tf-idf 从人的认知来理解什么是关键词,关键词一般具有以下特征: t 阅读全文

posted @ 2021-05-13 13:46 life‘s_a_struggle 阅读(221) 评论(0) 推荐(0) 编辑

2.评价推荐系统 & 策略验证方法

摘要: 一、推荐系统评价指标 CTR(点击率)= 点击量 /曝光量 CTR只能作为本系统不同策略的比较指标,不同系统的CTR比较没有意义 缺点在于,对三俗内容点击率可能比较高,避不开长尾问题 UCTR = 有点击行为对的用户 / 访问用户总量 如果CTR高,UCTR底说明可能存在用户流失。 覆盖度 = 推出 阅读全文

posted @ 2021-05-13 12:49 life‘s_a_struggle 阅读(703) 评论(0) 推荐(0) 编辑

1.推荐系统FLOW

摘要: 背景:推荐系统是随着互联网发展,数据出现迸发式增长。面对海量数据,用户对信息是茫然的。推荐系统应运而生,解决信息过载问题。 一、推荐系统概览 推荐系统 之 信息处理 顺序 1st 数据来源 2nd 内容审核 3rd 内容理解 4th 内容召回 5th 内容排序 解释 用户上传(UGC) 权威媒体(P 阅读全文

posted @ 2021-05-13 10:47 life‘s_a_struggle 阅读(47) 评论(0) 推荐(0) 编辑

对比:逻辑回归&支持向量机&因子分解机

摘要: 前言: 从去年的一月份报名马士兵教育人工智能系列课程已经4个月过去。学习过程中记了不少笔记,一直琢磨着待觉得差不多的时候将笔记稍作整理,建个博客。以费曼学习之法,加深记忆。刚好最近学习到了因子分解机器。顿挫之后决定以此作为第一篇博文论题之选。 14年毕业之后未再提笔学习,学习起步的过程非常的痛苦,今 阅读全文

posted @ 2021-05-13 09:35 life‘s_a_struggle 阅读(338) 评论(0) 推荐(0) 编辑