• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






2010120422

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2016年2月29日

相似度计算
摘要: 详解见网址 :https://dato.com/products/create/docs/generated/graphlab.recommender.item_similarity_recommender.ItemSimilarityRecommender.html?__hstc=8457130. 阅读全文
posted @ 2016-02-29 21:22 2010120422 阅读(196) 评论(0) 推荐(0)
 
特征选取
摘要: 特征选取的方式 文档频率 信息增益(决策树中的信息熵) 户信息量 λ2 测试 阅读全文
posted @ 2016-02-29 21:19 2010120422 阅读(150) 评论(0) 推荐(0)
 
LDA(文档主题模型)
摘要: LSA latent semantic analysis 映射词-文档到一个低维隐语义空间 比较词和文档在低纬空间的相似性 topic 是 Vocab 上的概率分布(符合多项式分布) 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型 plsa 模型 LDA模型 大规模LDA系统 s 阅读全文
posted @ 2016-02-29 17:57 2010120422 阅读(234) 评论(0) 推荐(0)