会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
yuki_lee
啦啦啦
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
下一页
2015年10月28日
[IR课程笔记]Page Rank
摘要: 主要目的: 在网络信息检索中,对每个文档的重要性作出评价。Basic Idea: 如果有许多网页链接到某一个网页,那么这个网页比较重要。 如果某个网页被一个权重较大的网页链接,那么这个网页比较重要。随机游走模型: 过程:1.在所有网页中,随机选择一个网页作为游走的开端。 2.然后在当前网...
阅读全文
posted @ 2015-10-28 17:42 Yuki_i
阅读(537)
评论(1)
推荐(0)
2015年10月23日
[数据挖掘课程笔记]关联规则挖掘 - Apriori算法
摘要: 两种度量: 支持度(support) support(A→B) = count(AUB)/N (N是数据库中记录的条数) 自信度(confidence)confidence(A→B) = count(AUB)/count(A)关联规则挖掘的基本两个步骤: 1.找出所有的频繁项集 2.由频繁...
阅读全文
posted @ 2015-10-23 01:05 Yuki_i
阅读(2034)
评论(0)
推荐(1)
2015年10月18日
[IR课程笔记]概率检索模型
摘要: 几个符号意义: R:相关文档集 NR:不相关文档集 q:用户查询 dj:文档j1/0风险情况 PRP(probability ranking principle):概率排序原理,利用概率模型来估计每篇文档和需求相关概率,然后对结果进行排序。 贝叶斯最优决策原理,基于最小损失风险作...
阅读全文
posted @ 2015-10-18 17:28 Yuki_i
阅读(1385)
评论(0)
推荐(0)
[IR课程笔记]向量空间模型(Vector Space Model)
摘要: VSM思想 把文档表示成R|v|上的向量,从而可以计算文档与文档之间的相似度(根据欧氏距离或者余弦夹角) 那么,如何将文档将文档表示为向量呢? 首先,需要选取基向量/dimensions,基向量须是线性独立的或者正交的向量。 在IR系统中,有两种方式决定基向量: 1.核心概念的思想(core...
阅读全文
posted @ 2015-10-18 14:48 Yuki_i
阅读(1050)
评论(0)
推荐(0)
[IR课程笔记]统计语言模型
摘要: Basic idea 1.一个文档(document)只有一个主题(topic) 2.主题指的是这个主题下文档中词语是如何出现的 3.在某一主题下文档中经常出现的词语,这个词语在这个主题中也是经常出现的。 4.在某一主题下文档中不经常出现的词语,这个词语在这个主题中也是不经常出现的。 5.由...
阅读全文
posted @ 2015-10-18 13:45 Yuki_i
阅读(1119)
评论(0)
推荐(0)
2015年10月16日
[数据挖掘课程笔记]人工神经网络(ANN)
摘要: 人工神经网络(Artificial Neural Networks)顾名思义,是模仿人大脑神经元结构的模型。上图是一个有隐含层的人工神经网络模型。X = (x1,x2,..,xm)是ANN的输入,也就是一条记录的在m个属性上的值。每个属性对应一个输入节点。 对于输入层来说,输入层的输...
阅读全文
posted @ 2015-10-16 01:00 Yuki_i
阅读(1794)
评论(0)
推荐(0)
2015年10月13日
[数据挖掘课程笔记]基于规则的分类-顺序覆盖算法(sequential covering algorithm)
摘要: Rule_set = {}; //学习的规则集初试为空for 每个类c do repeat Rule = Learn_One_Rule(D,Att-vals,c) 从D中删除被Rule覆盖的元组; until终止条件被满足 Rule_set...
阅读全文
posted @ 2015-10-13 21:56 Yuki_i
阅读(3922)
评论(0)
推荐(0)
[数据挖掘课程笔记]Naïve Bayesian Classifier
摘要: 朴素贝叶斯模型 1) X:一条未被标记的数据 2) H:一个假设,如H=X属于Ci类 根据贝叶斯公式 把X表示为(x1,x2,....xn)x1,x2,....xn表示X在各个特征上的值。 假设有c1,c2,c3...cm个类别。 那么这个对X的分类问题就可以转化为找出使P(...
阅读全文
posted @ 2015-10-13 00:20 Yuki_i
阅读(467)
评论(0)
推荐(0)
2015年10月8日
[数据挖掘课程笔记]SLIQ算法
摘要: 1.数据结构 主要的数据结构有:1.Attribute List 2.Class List 对于数据集,每一个属性都有一个对应的Attribute List.如上图所示,每个Attribute List有两列,分别是对应的属性值和该条记录在Class List里的索引。根据不同的索引值...
阅读全文
posted @ 2015-10-08 20:06 Yuki_i
阅读(2630)
评论(0)
推荐(0)
2013年5月31日
POJ2318TOYS(叉乘)
摘要: 题意:给你一个箱子,已知隔板的位置,在给你玩具的位置,要你算出每个被隔出来的区域里有几个玩具。。。想法:利用叉乘,某玩具在X区域里,那么,这个点就在第x-1条线的右手边,第x条线的左手边,左右手方向利用叉乘来判断。。另外,我把左右边界也加入进了所以的线里面。。这样就不需要特殊判断了。。。 1 #include<stdio.h> 2 #include<string.h> 3 typedef struct point 4 { 5 int x,y; 6 }point; 7 typedef struct line 8 { 9 point a,b;10 }line;11 line
阅读全文
posted @ 2013-05-31 16:41 Yuki_i
阅读(274)
评论(0)
推荐(0)
上一页
1
2
3
下一页
公告