• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
jiajia920716
博客园    首页    新随笔    联系   管理    订阅  订阅
2013年6月19日
文本分类(基于朴素贝叶斯分类器)
摘要: 一. 概率论基础1. 条件概率公式:2. 全概率公式:3. 由条件概率公式和全概率公式可以导出贝叶斯公式二. 文本分类要计算一篇文章D所属的类别c(D),相当于计算生成D的可能性最大的类别,即:其中P(D)与C无关,故三. 朴素贝叶斯分类模型朴素贝叶斯假设:在给定类别C的条件下,所有属性Di相互独立,即,根据朴素贝叶斯假设,可得其中, :类别c中的训练文本数 :总训练文本数 :单词di在类别c中出现的次数综上可得,四. 具体代码(源代码)程序采用java语言进行编写,运用搜狗语料库进行训练。具体程序代码如下:Main.java——主程序,负责读取待分类文章以及调用分类器package clas 阅读全文
posted @ 2013-06-19 23:23 jiajia920716 阅读(1839) 评论(0) 推荐(1)
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3