09 2018 档案
摘要:特征构建是指通过研究原始数据样本,结合机器学习实战经验和相关领域的专业知识,思考问题的潜在形式和数据结构,人工创造出新的特征,而这些特征对于模型训练又是有益的并且具有一定的工程意义。特征构建的方式主要有单列操作、多列操作、 分组/聚合操作这三种。1. 单列操作在pan...
阅读全文
摘要:机器学习实战的特征工程主要包含数据预处理、特征构建、特征选择三步,首先来介绍数据预处理。我选择python作为工具,并将主要用到pandas、numpy等数据工具库。加载库:import pandas as pdimport numpy as np1. 观察数据(1)...
阅读全文
摘要:一、什么是F1-scoreF1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重...
阅读全文

浙公网安备 33010602011771号