摘要: 聚类分析 常用方法 k均值,DBSCAN,两步聚类,BIRCH,谱聚类 解决的问题 数据集分为几类 每个类别有多少样本量 不同类别各个变量的强弱关系 不同类别的典型特征是什么 超大数据量时应该放弃K均值算法,可以考虑Mini Batch KMeans 回归分析 主要应用场景 计划制定,KPI制定,目 阅读全文
posted @ 2019-07-23 15:53 Rener 阅读(201) 评论(0) 推荐(0)
摘要: 样式美化 style 所有样式 语法:print(plt.style.available) 使用样式 语法:plt.style.use('ggplot') 画图 创建画布 设置标题 图例 legend 批量增加图例 x轴标题,y轴标题 xlabel,ylabel 用法同title 刻度线标签 xti 阅读全文
posted @ 2019-07-23 12:59 Rener 阅读(549) 评论(0) 推荐(0)
摘要: ``` def calPerformance(y_true,y_pred): ''' 模型效果指标评估 y_true:真实的数据值 y_pred:回归模型预测的数据值 explained_variance_score:解释回归模型的方差得分,其值取值范围是[0,1],越接近于1说明自变量越能解释因变量 的方差变化,值越小则说明效果越差。 me... 阅读全文
posted @ 2019-07-23 12:46 Rener 阅读(10217) 评论(0) 推荐(1)