上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 39 下一页
摘要: 1 比赛 常见名词: Feature 特征变量,也叫自变量,是样本可以观测到的特征,通常是模型的输入。 Label 标签,也叫目标变量,需要预测的变量,通常是模型的标签或者输出。 Train Data 训练数据,有标签的数据,由举办方提供。 Test Data 测试数据,标签未知,是比赛用来评估得分 阅读全文
posted @ 2021-09-28 11:32 Trouvaille_fighting 阅读(75) 评论(0) 推荐(0)
摘要: 1 求诸文献 读本领域的综述 方向要稍微具体一些 年份要近 确定这个方向的大框架,有哪些具体的子方向 每个方向都做了什么样的研究,大致有哪些方法 如果这个方向好多年都没有新综述,那么这个方向的研究意义就不大了 经过这步,那么就可以选出一个感兴趣的小方向,作为自己接下来的研究目标了 海量读文献,找到创 阅读全文
posted @ 2021-09-28 10:19 Trouvaille_fighting 阅读(1752) 评论(0) 推荐(0)
摘要: 1 需要学到什么 2 资源 课程主页:https://courses.d2l.ai/zh-v2 教材:http://zh-v2.d2l.ai/ 课程论坛讨论:https://discuss.d2l.ai/c/16 Pytorch论坛:https://discuss.pytorch.org/ 3 深度 阅读全文
posted @ 2021-09-27 15:50 Trouvaille_fighting 阅读(53) 评论(0) 推荐(0)
摘要: 在计算的过程中,如何选择合适的算法进行计算,可以参考scikit learn官方给的指导意见: 阅读全文
posted @ 2021-09-27 11:11 Trouvaille_fighting 阅读(44) 评论(0) 推荐(0)
摘要: 探究用户对物品类别的喜好细分 应用pca和K-means实现用户对物品类别的喜好细分划分 数据如下: order_products__prior.csv:订单与商品信息 字段:order_id, product_id, add_to_cart_order, reordered products.cs 阅读全文
posted @ 2021-09-27 11:07 Trouvaille_fighting 阅读(347) 评论(0) 推荐(0)
摘要: 1 降维 1.1 定义 降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 降低随机变量的个数 正是因为在进行训练的时候,我们都是使用特征进行学习。如果特征本身存在问题或者特征之间相关性较强,对于算法学习预测会影响较大 1.2 降维的两种方式 特征选择 主成分分析(相 阅读全文
posted @ 2021-09-27 10:46 Trouvaille_fighting 阅读(2215) 评论(0) 推荐(0)
摘要: 1 误差平方和(SSE) 误差平方和的值越小越好 在k-means中的应用: 公式各部分内容(k=2): 举例: 下图中数据-0.2, 0.4, -0.8, 1.3, -0.7, 均为真实值和预测值的差 总结: SSE图最终的结果,对图松散度的衡量.(eg: SSE(左图)<SSE(右图)) SSE 阅读全文
posted @ 2021-09-26 10:57 Trouvaille_fighting 阅读(7915) 评论(0) 推荐(1)
摘要: 1 K-means解释 k-means其实包含两层内容: ​ - K : 初始中心点个数(计划聚类数) ​ - means:求中心点到其他数据点距离的平均值 2 k-means聚类步骤 1、随机设置K个特征空间内的点作为初始的聚类中心 2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚 阅读全文
posted @ 2021-09-26 10:49 Trouvaille_fighting 阅读(2215) 评论(0) 推荐(0)
摘要: 1 api介绍 sklearn.cluster.KMeans(n_clusters=8) 参数: n_clusters:开始的聚类中心数量,产生的质心数。 方法: estimator.fit(x) estimator.predict(x) estimator.fit_predict(x) fit_p 阅读全文
posted @ 2021-09-26 10:20 Trouvaille_fighting 阅读(187) 评论(0) 推荐(0)
摘要: 1 聚类算法的概念 一种典型的无监督学习算法, 主要用于将相似的样本自动归到一个类别中 计算样本和样本之间的相似性,一般使用欧式距离 聚类算法分类 粗聚类 细聚类 2 聚类算法与分类算法最大的区别 聚类算法是无监督的学习算法,而分类算法属于监督的学习算法。 3 聚类算法在现实中的应用 用户画像,广告 阅读全文
posted @ 2021-09-26 09:58 Trouvaille_fighting 阅读(1277) 评论(0) 推荐(0)
上一页 1 ··· 27 28 29 30 31 32 33 34 35 ··· 39 下一页