• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
贞子小白白
博客园    首页    新随笔    联系   管理    订阅  订阅
2021年4月16日
【NLP】|01 NLP常见模型(三)LDA
摘要: 理论:参考链接 Beta分布是二项式分布的共轭先验分布,而狄利克雷(Dirichlet)分布是多项式分布的共轭分布。 共轭的意思是,以Beta分布和二项式分布为例,数据符合二项分布的时候,参数的先验分布和后验分布都能保持Beta分布的形式,这种形式不变的好处是,我们能够在先验分布中赋予参数很明确的物 阅读全文
posted @ 2021-04-16 18:28 贞子小白白 阅读(118) 评论(0) 推荐(0)
【NLP】|01 NLP常见模型(二)句法分析
摘要: 一、句法分析 参考链接1,参考链接2 将顺序输入的句子输出成树形符合句子结构的非线性数据结构。 CFG 现在一般都是用seq2seq模型来做的。 PCFG,在每个语法后面标注使用这个语法的概率: 使用PCFG计算每棵树的score,用来选择最好的那棵树。 如果枚举所有的树去找概率,计算量太大,指数级 阅读全文
posted @ 2021-04-16 17:42 贞子小白白 阅读(172) 评论(0) 推荐(0)
【NLP】|01 NLP常见模型(一)Word2Vec
摘要: 一、Word2Vec: 参考学习链接 1.需要具备的基础知识: - 哈夫曼树、哈夫曼编码(变长编码,高频距离root近) - 【统计语言模型】N-gram模型(这里模型表示的下标和上标表示起始和终止,表示第k个单词被假设只和其前n-1个单词相关,也就是【k-(n-1)一直到k-1】) 传统的方法需要 阅读全文
posted @ 2021-04-16 16:32 贞子小白白 阅读(206) 评论(0) 推荐(0)
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3