会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
BlowingInTheWind
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
2019年12月3日
FM/FFM算法
摘要: 一、数据格式 1.1 libffm数据格式定义 为了使用FM/FFM方法,所有的特征必须转换成“field_id:feat_id:value”类型的libffm格式,field_id代表特征所属field的编号,feat_id是特征编号,value是特征的值。注意第一列插入为target值。 数值型
阅读全文
posted @ 2019-12-03 23:39 BlowingInTheWind
阅读(779)
评论(0)
推荐(0)
2019年11月29日
LR(逻辑回归)分类算法
摘要: 一、算法原理 LR算法:通过线性映射和sigmoid转换确定{0,1}间条件概率。 1.1 模型表达(Objective Function) 逻辑回归也被称为对数几率回归,用条件概率分布的形式表示 P(Y|X),这里随机变量 X 取值为 n 维特征向量,例如x=(x(1),x(2),...,x(n)
阅读全文
posted @ 2019-11-29 15:46 BlowingInTheWind
阅读(1249)
评论(0)
推荐(0)
2019年11月28日
KNN(K近邻)分类算法
摘要: 一、算法原理 KNN算法是机器学习中最基本算法之一,属于惰性学习算法的典例。惰性指模型仅通过对训练数据集的记忆功能进行预测,而不产生判别函数。 KNN算法本身很简单,归纳为如下几步:①选择近邻数量k和距离度量的方法②找到待分类样本的k个最近邻③根据最近邻类标进行多数投票 二、超参数(结合sklear
阅读全文
posted @ 2019-11-28 22:26 BlowingInTheWind
阅读(484)
评论(0)
推荐(0)
2019年11月25日
数据预处理—标准化/归一化方法(scaler)
摘要: 数据标准化是数据预处理的重要步骤。 sklearn.preprocessing下包含 StandardScaler, MinMaxScaler, RobustScaler三种数据标准化方法。本文结合sklearn文档,对各个标准化方法的应用场景以及优缺点加以总结概括。 首先,不同类型的机器学习模型对
阅读全文
posted @ 2019-11-25 22:29 BlowingInTheWind
阅读(4274)
评论(0)
推荐(0)
2019年11月16日
分类算法评价指标
摘要: 1. 准确率/召回率/f1分数 2. Auc(一般用于二分类) 3. kappa系数(一般用于多分类) 3.1 简单kappa(simple kappa) Kappa系数用于一致性检验,代表着分类与完全随机的分类产生错误减少的比例,kappa系数的计算是基于混淆矩阵的。 kappa计算结果为-1~1
阅读全文
posted @ 2019-11-16 02:42 BlowingInTheWind
阅读(1217)
评论(0)
推荐(0)
上一页
1
2
公告