Fork me on GitHub

随笔分类 -  AI人工智能

机器学习、深度学习、推荐算法
摘要:广告点击率(CTR)预测项目 点击率(Click through rate)预估用来判断一条广告被用户点击的概率,对每次广告的点击做出预测,把用户最有可能点击的广告找出来,是广告技术最重要的算法之一。 https://www.kaggle.com/c/avazu-ctr-prediction Dat 阅读全文
posted @ 2021-08-29 17:06 kris12 阅读(1182) 评论(0) 推荐(0)
摘要:逻辑回归 Logistic Regression 是一个非常经典的二分类算法 ,也可以用于多分类(只需做个转换即可) 1. 逻辑回归中的条件概率 谈到分类,也许没有比逻辑回归更简单的方法了,受到工业界的极大的欢迎。逻辑回归的基本概念,以及如何一步步来构建逻辑回归中起到最核心作用的条件概率。 逻辑回归 阅读全文
posted @ 2021-08-28 09:44 kris12 阅读(2611) 评论(0) 推荐(0)
摘要:模型的泛化 1. 过拟合 在机器学习建模中面临一个极其重要的问题 - “过拟合”。 基于逻辑回归模型来剖析什么是过拟合,如何正确地理解过拟合现象,减轻过拟合现象的几种方法。 逻辑回归的参数 即便是一个简单的逻辑回归模型,当我们去调用模型时需要选择性地设置它的一些参数,这些参数的设定对模型训练后的结果 阅读全文
posted @ 2021-08-08 16:25 kris12 阅读(1208) 评论(0) 推荐(0)
摘要:1. 人工智能 所谓人工智能就是利用数学统计方法,统计数据中的规律,然后利用这些统计规律进行自动化数据处理,使计算机表现出某种智能的特性,而各种数学统计方法,就是大数据算法。 人工智能(AI),几乎的行业跟AI息息相关。谈到AI,很多人的脑海里第一个浮现出的可能是当年火遍全球的 AlphaGo 的事 阅读全文
posted @ 2021-07-27 08:45 kris12 阅读(2895) 评论(0) 推荐(0)
摘要:线性回归 在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间互相依赖的定量关系的一种统计分析方法。 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 所有机器学习方法论里,线性回归绝对是最简单且最实用的方法。只要涉及到回归问题,第一时间 阅读全文
posted @ 2021-07-25 17:58 kris12 阅读(600) 评论(0) 推荐(0)
摘要:1. 自然语言处理应用 自然语言处理(Natural Language Processing, NLP),通过理解人类语言来解决实际问题的一门学科。 自然语言处理不仅是学术界的研究热点,在工业界也有许多成果,如谷歌的文本搜索引擎、苹果的Siri、微软小冰等。 对自然语言处理问题的研究可以追溯到二十世 阅读全文
posted @ 2021-05-23 15:43 kris12 阅读(427) 评论(0) 推荐(0)
摘要:数据生命周期 项目系统架构 用户可视化:主要负责实现和用户的交互以及业务数据的展示,主体采用AngularJS2进行实现,部署在Apache服务上。 综合业务服务:主要实现JavaEE层面整体的业务逻辑,通过Spring进行构建,对接业务需求。部署在Tomcat上。 【数据存储部分】 业务数据库:项 阅读全文
posted @ 2019-11-28 09:00 kris12 阅读(1033) 评论(0) 推荐(0)
摘要:一、离线推荐服务 离线推荐服务是综合用户所有的历史数据,利用设定的离线统计算法和离线推荐算法周期性的进行结果统计与保存,计算的结果在一定时间周期内是固定不变的,变更的频率取决于算法调度的频率。 离线推荐服务主要计算一些可以预先进行统计和计算的指标,为实时计算和前端业务相应提供数据支撑。 离线推荐服务 阅读全文
posted @ 2019-11-28 08:59 kris12 阅读(1767) 评论(0) 推荐(0)
摘要:重新定义什么是推荐系统:它能做什么;它需要什么;它怎么做。对于第一个问题“它能做什么”,我的回答是:推荐系统可以把那些最终会在用户(User)和物品(Item)之间产生的连接提前找出来。这里简单说一下“连接”这个词,这个词含义非常广泛,凡是能够产生关系的都是连接,比如用户对物品做出了一个行为,或者用 阅读全文
posted @ 2019-10-16 23:38 kris12 阅读(497) 评论(0) 推荐(0)
摘要:3. 基于协同过滤的推荐算法 (用户和物品的关联) 协同过滤(Collaborative Filtering,CF)-- 用户和物品之间关联的用户行为数据 ①基于近邻的协同过滤 基于用户(User-CF) --用户画像 基于物品(Item-CF) -- 基于内容-特征工程 ②基于模型的协同过滤 奇异 阅读全文
posted @ 2019-09-18 11:44 kris12 阅读(5059) 评论(1) 推荐(1)
摘要:常用推荐算法分类 实时和离线; 是否个性化推荐;基于统计的推荐; 个性化推荐的原则:如可以基于相似度去划分、基于已有的知识去推荐、基于模型的推荐(去学习这个推荐的模型); 按数据源划分:用户、物品、用户行为数据即它们俩之间的关系; 基于人口统计学的推荐(基于用户)与用户画像 基于内容的推荐(基于物品 阅读全文
posted @ 2019-09-18 11:43 kris12 阅读(2360) 评论(1) 推荐(0)
摘要:1. knn概述 分类是大数据常见的应用场景之一,通过对历史数据规律的统计,将大量数据进行分类然后发现数据之间的关系,这样当有新的数据进来时,计算机就可以利用这个关系自动进行分类了。更进一步讲, 如果这个分类结果在将来才被证实,比如一场比赛的胜负、一次选举的结果,那么在旁观者看来,就是在利用大数据进 阅读全文
posted @ 2018-09-19 22:43 kris12 阅读(2361) 评论(0) 推荐(0)

levels of contents