摘要: 1. sklearn中的Pipeline机制 管道机制在机器学习算法中的应用:参数集在新数据集(比如测试集)上的重复使用。 管道机制实现流式化封装和管理。 2. 加载数据集并拆分 import pandas as pd from sklearn.pipeline import Pipeline fr 阅读全文
posted @ 2020-07-23 12:19 做梦当财神 阅读(297) 评论(0) 推荐(0)
摘要: DBSCAN是密度聚类算法,和K-Means,BIRCH只适用于凸样本集的聚类相比,DBSCAN既适用于凸样本集,也适用于非凸样本集。 1. 密度聚类原理 DBSCAN算法指类别可通过样本分布的紧密程度决定。即同一类别的样本紧密相连,也就是说在该类别的不远处一定有同类别的样本。 2. DBSCAN密 阅读全文
posted @ 2020-07-23 11:24 做梦当财神 阅读(869) 评论(0) 推荐(0)