• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






dark_lake

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2012年7月15日

序列模式挖掘 小笔
摘要: 序列模型在关联模型的基础上进一步考虑了事务间的顺序,譬如客户购买商品时会先买床然后再买床上用品登登。所以序列模型的研究是有一定意义的。书上指出两个适应本规则的应用,web数据挖掘中,从用户浏览网页的顺序中挖掘网站的浏览模型;文本挖掘中,根据刺在句中的顺序挖掘语言模式。sequence:是经过排序的项集。序列s可用用<a1a2...ar>表示,其中ai就是一个项集,可以表示为{x1,x2,...,xk}。那么r即为序列s的基数,k为s的长度。长度为k的序列称为k-序列。序列模式的目标:给出一个序列数据库(sequence database),找出所有满足用户指定的最小支持度的序列。每 阅读全文
posted @ 2012-07-15 13:45 dark_lake 阅读(532) 评论(0) 推荐(0)
 
现代信息检索 小笔
摘要: 信息检索:ARSOA,从文档集合中返回满足用户需求的相关信息的过程。研究信息的获取(acquisition)、表示(representation)、存储(stotage)、组织(organization)和访问(access)。信息检索的两种研究方式:以计算机为中心:IR的工作主要是建立索引、对用户查询进行处理、排序算法等等以用户为中心:IR的主要工作是考察用户的行为、理解用户的需求、这些行为和需求如何影响检索系统的组织IR系统的组成部分1、用户接口(user interface) 输入查询(query) 返回排序后的排序文档并对其可视化 Feedback用户的两种任务:retrieva... 阅读全文
posted @ 2012-07-15 13:38 dark_lake 阅读(143) 评论(0) 推荐(0)