会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
栽种绝处的花
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
5
6
7
8
9
10
11
12
13
14
下一页
2016年2月6日
机器学习实战读书笔记(四)基于概率论的分类方法:朴素贝叶斯
摘要: 4.1 基于贝叶斯决策理论的分类方法 朴素贝叶斯 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对于输入数据的准备方式较为敏感 适用数据类型:标称型数据 贝叶斯决策理论的核心思想:选择具有最高概率的决策。 4.2 条件概率 4.3 使用条件概率来分类 4.4 使用朴素贝叶斯进行文档分类
阅读全文
posted @ 2016-02-06 18:01 地表最强队队员
阅读(783)
评论(0)
推荐(0)
2016年1月29日
推荐系统读书笔记(五)利用上下文信息
摘要: 上下文包括用户访问推荐系统的时间、地点、心情等。 5.1 时间上下文信息 5.1.1 时间效应简介 时间信息对用户兴趣的影响表现在以下几个方面: 1.用户兴趣是变化:关注最近行为 2.物品也是有生命周期的: 3.季节效应 5.1.2 时间效应举例 5.1.3 系统时间特性的分析 包含时间信息的用户行
阅读全文
posted @ 2016-01-29 17:33 地表最强队队员
阅读(2459)
评论(0)
推荐(0)
推荐系统读书笔记(三)推荐系统冷启动问题
摘要: 3.1 冷启动问题简介 主要分三类: 1.用户冷启动:如何给新用户做个性化推荐。 2.物品冷启动:如何将新的物品推荐给可能对它感兴趣的用户这一问题。 3.系统冷启动:如何在一个新开发的网站上设计个性化推荐系统。 解决方案: 1.提供非个性化的推荐:热门排行榜,当用户数据收集到一定的时候,再切换为个性
阅读全文
posted @ 2016-01-29 15:10 地表最强队队员
阅读(4994)
评论(0)
推荐(0)
2016年1月26日
推荐系统读书笔记(二)利用用户行为数据
摘要: 2.1 用户行为数据简介 显性反馈行为:用户明确表示对物品喜好的行为。评分、喜欢、不喜欢。 隐性反馈行为:不能明确反应用户喜好的行为。比如页面浏览。 显性反馈数据 隐性反馈数据 用户兴趣 明确 不明确 数量 较少 庞大 存储 数据库 分布式文件系统 实时读取 实时 有延迟 正负反馈 都有 只有正反馈
阅读全文
posted @ 2016-01-26 18:53 地表最强队队员
阅读(5885)
评论(0)
推荐(0)
2016年1月24日
推荐系统读书笔记(一)好的推荐系统
摘要: 1.1 什么是推荐系统 80/20原则:80%的销售额来自于20%的热门品牌 不热门的商品数量极其庞大,这些长尾商品的总销售额将是一个不可小觑的数字,也许会超过热门商品带来的销售额。 主流商品代表了绝大多数用户的需求,而长尾商品代表了一小部分用户的个性化需求。 推荐系统通过发掘用户的行为,找...
阅读全文
posted @ 2016-01-24 19:52 地表最强队队员
阅读(2178)
评论(0)
推荐(0)
数据挖掘概念与技术读书笔记(二)认识数据
摘要: 2.1 数据对象与属性类型2.1.1 什么是属性2.1.2 标称属性:其值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看作是分类的。 标称属性不是定量的,找出它的均值或中位数没有意义,有意义的是找到众数,是一种中心趋势度量。2.1.3 二元属性:是一种标称属性,只有两个...
阅读全文
posted @ 2016-01-24 18:13 地表最强队队员
阅读(1395)
评论(0)
推荐(0)
2015年12月21日
Linux编辑器vi使用方法详细介绍
摘要: 1、vi的基本概念 基本上vi可以分为三种状态,分别是命令模式(command mode)、插入模式(Insert mode)和底行模式(last line mode),各模式的功能区分如下: 1) 命令行模式command mode) 控制屏幕光标的移动,字符、字或行的删除,移动复制某区段及...
阅读全文
posted @ 2015-12-21 20:01 地表最强队队员
阅读(229)
评论(0)
推荐(0)
用户不在sudoers文件中的解决方法
摘要: 在使用Linux系统过程中,通常情况下,我们都会使用普通用户进行日常操作,而root用户只有在权限分配及系统设置时才会使用,而root用户的密码也不可能公开。普通用户执行到系统程序时,需要临时提升权限,sudo就是我们常用的命令,仅需要输入当前用户密码,便可以完成权限的临时提升。在使用sudo命令的...
阅读全文
posted @ 2015-12-21 20:00 地表最强队队员
阅读(4038)
评论(0)
推荐(0)
2015年12月6日
机器学习实战读书笔记(三)决策树
摘要: 3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createD...
阅读全文
posted @ 2015-12-06 19:40 地表最强队队员
阅读(542)
评论(0)
推荐(0)
2015年12月5日
机器学习实战读书笔记(二)k-近邻算法
摘要: knn算法:1.优点:精度高、对异常值不敏感、无数据输入假定2.缺点:计算复杂度高、空间复杂度高。3.适用数据范围:数值型和标称型。一般流程:1.收集数据2.准备数据3.分析数据4.训练算法:不适用5.测试算法:计算正确率6.使用算法:需要输入样本和结构化的输出结果,然后运行k-近邻算法判定输入数据...
阅读全文
posted @ 2015-12-05 14:40 地表最强队队员
阅读(422)
评论(0)
推荐(0)
上一页
1
···
5
6
7
8
9
10
11
12
13
14
下一页
公告