摘要:功能丰富的API 搭建 1 import numpy as np 2 import tensorflow as tf 3 from tensorflow import keras 4 from tensorflow.keras import layers 介绍 Keras functional AP
阅读全文
摘要:推荐系统之内容召回2——基于行为的 以短视频推荐为例 类 user和video的关系 信息 C1 没见过的video 海量video C2 见过,但未点击的video user不感兴趣,视频量很大 Negative(VN) C3 见过并点击观看 user感兴趣,少量的一部分 Postive(VP)
阅读全文
摘要:推荐系统之内容召回1——基于内容的 基于内容的召回 基于行为的召回 多路召回 热点召回 一、基于内容的召回 文章召回文章 基于文章相同关键词得分做排序推荐 1 import json 2 3 4 with open("article_keywords") as f: 5 lines=f.readli
阅读全文
摘要:word2vec 14年被谷歌搞出来的,社交领域运用十分广泛,并很快被除了文本中之外的其他邻域运用。 首先,了解什么是语言模型: 判断(计算)一句话合理的概率 用周边词预测一个位置出现词的概率(类似于完形填空) 一、模型构建: step1 : 假设我们有一个sentence:w1, w2, w3,
阅读全文
摘要:NLP(Nature Language Processing) 中文自动分词(Chinese word segmentation) 词性标注(Part-of-speech tagging) 句法分析(Parsing) 自然语言生成(Natural language generation) 文本分类(
阅读全文
摘要:推荐系统 之 内容理解 提取内容关键词 对内容品类进行提取 关键词分两种: 外显关键词,要求质量高,用户看的到的Tag 隐形关键词,要求低一些,用户看不到,用于分发。 一、关键词提取 可以从标题中提取,也可从正文中提取。 方法:tf-idf 从人的认知来理解什么是关键词,关键词一般具有以下特征: t
阅读全文
摘要:一、推荐系统评价指标 CTR(点击率)= 点击量 /曝光量 CTR只能作为本系统不同策略的比较指标,不同系统的CTR比较没有意义 缺点在于,对三俗内容点击率可能比较高,避不开长尾问题 UCTR = 有点击行为对的用户 / 访问用户总量 如果CTR高,UCTR底说明可能存在用户流失。 覆盖度 = 推出
阅读全文
摘要:背景:推荐系统是随着互联网发展,数据出现迸发式增长。面对海量数据,用户对信息是茫然的。推荐系统应运而生,解决信息过载问题。 一、推荐系统概览 推荐系统 之 信息处理 顺序 1st 数据来源 2nd 内容审核 3rd 内容理解 4th 内容召回 5th 内容排序 解释 用户上传(UGC) 权威媒体(P
阅读全文
摘要:前言: 从去年的一月份报名马士兵教育人工智能系列课程已经4个月过去。学习过程中记了不少笔记,一直琢磨着待觉得差不多的时候将笔记稍作整理,建个博客。以费曼学习之法,加深记忆。刚好最近学习到了因子分解机器。顿挫之后决定以此作为第一篇博文论题之选。 14年毕业之后未再提笔学习,学习起步的过程非常的痛苦,今
阅读全文