会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
刘二逗呀
博客园
首页
新随笔
联系
订阅
管理
2019年7月16日
常见算法面试之样本不均衡的解决办法、交叉熵以及HMM、MEMM vs CRF
摘要: 恢复内容开始 1、样本类别不均衡的解决办法 把数据进行采用的过程中通过相似性同时生成并插样“少数类别数据”,叫做SMOTE算法 对数据先进行聚类,再将大的簇进行随机欠采样或者小的簇进行数据生成 把监督学习变成无监督学习,舍弃掉标签把问题转化为一个无监督问题,如异常检测 先对多数类别进行随机的欠采样,
阅读全文
posted @ 2019-07-16 14:52 刘二逗呀
阅读(1703)
评论(0)
推荐(1)
公告