会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
忘川水间
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
2020年3月21日
图像标注-分词
摘要: 英文通过空格区分单词,而中文的词语间没有显著的划分标志。如果想对 中文语料进行分词,推荐结巴分词。 安装命令:pip install jieba
阅读全文
posted @ 2020-03-21 23:00 忘川水间
阅读(112)
评论(0)
推荐(0)
2020年2月29日
机器学习基础梳理—(K-近邻算法浅谈)
摘要: K-近邻算法可用在二类分类,多类分类和回归问题上 基本要素: K值的选择,距离度量和分类决策规则 减小K值:近似误差减小,估计误差增大,增大K值则相反K值通常不大于20;距离 度量:Lp距离;分类决策规则:多数表决 工作原理: 1、有监督学习:标签化数据集 2、测试阶段:输入无标签新数据后,将新数据
阅读全文
posted @ 2020-02-29 09:21 忘川水间
阅读(146)
评论(0)
推荐(0)
2020年2月22日
机器学习基础梳理—(感知机浅谈)
摘要: 1、感知机基础 感知机是一种二类分类模型,训练样本需要完全线性可分,学习策略包括两种:一种是误分 类点的数目,另外一种是误分类点到分离超平面的总距离,通过梯度下降法最小化损失函数。 分离超平面:w * x + b = 0 误分类点:-y(i) * (w * x(i) + b) > 0,若不等式成立,
阅读全文
posted @ 2020-02-22 10:26 忘川水间
阅读(148)
评论(0)
推荐(0)
2020年2月18日
机器学习基础梳理—(支持向量机浅谈)
摘要: 一、SVM基础 支持向量机(SVM)是一种二分类模型,有别于感知机(误分类点到超平面的总距离),SVM的学习策略是间隔 最大化,当训练样本完全线性可分时,采用硬间隔最大化,称为线性可分支持向量机;当训练样本近似线 性可分时,增加松弛变量,采用软间隔最大化,称为线性支持向量机;在非线性问题中引入了核函
阅读全文
posted @ 2020-02-18 20:46 忘川水间
阅读(293)
评论(0)
推荐(0)
2020年2月14日
机器学习基础梳理—(accuracy,precision,recall浅谈)
摘要: 一、TP TN FP FN TP:标签为正例,预测为正例(P),即预测正确(T) TN:标签为负例,预测为负例(N),即预测正确(T) FP:标签为负例,预测为正例(P),即预测错误(F) FN:标签为正例,预测为负例(N),即预测错误(F) 其中 T:True F:False P:Positive
阅读全文
posted @ 2020-02-14 23:44 忘川水间
阅读(613)
评论(0)
推荐(0)
公告