会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
SENTIMENT_SONNE
博客园
首页
新随笔
订阅
管理
2019年11月21日
NLP 语料分类不均衡/数据倾斜/data skew
摘要: 数据层面: 过抽样 直接复制,即不断复制类别样本数少的类别样本。 插值法:通过对样本归一化,采样,求得样本分布,极值,均值等,然后根据样本分布,极值,均值来生成新样本来扩充样本数目。 欠抽样: 直接删除,随机减少多数类样本的数量。 算法层面: Weighted loss function,一个处理非
阅读全文
posted @ 2019-11-21 22:22 SENTIMENT_SONNE
阅读(619)
评论(0)
推荐(0)
公告