数据挖掘 - 随笔分类 - 折木家的招财猫

聚类

摘要：聚类聚类评估算法 Silhouette算法：轮廓系数法簇内不相似度：$a_i$样本i到同簇其它样本的平均距离簇间不相似度：$b_i$样本到其它某簇的所有样本的平均距离定义样本的轮廓系数： $s(i) = \frac{b_i-a_i}{max\{a_i,b_i\}}$ $s(i) $接近1 阅读全文

posted @ 2021-11-18 13:22 折木家的招财猫阅读(158) 评论(0) 推荐(0)

关联规则

摘要：支持度&置信度 $Support(X\rightarrow Y)=\frac{(X\bigcup Y)}{n}$ $Confidence(X\rightarrow Y)=\frac{(X\bigcup Y)}{X}$ 因果关系≠关联性置信度和支持度都是统计出来的条件概率，不能说明全部的问题阅读全文

posted @ 2021-11-18 11:01 折木家的招财猫阅读(229) 评论(0) 推荐(0)

神经网络

摘要：神经网络神经网络从感知机演化而来，讲的人太多了，看看别人讲的吧，就不重复了 https://blog.csdn.net/xuanwolanxue/article/details/71565934 阅读全文

posted @ 2021-10-28 10:00 折木家的招财猫阅读(74) 评论(0) 推荐(0)

SVM小结

摘要：![](https://img2020.cnblogs.com/blog/2138682/202110/2138682-20211028093742047-1761353873.jpg) ![](https://img2020.cnblogs.com/blog/2138682/202110/2138682-20211028093748380-989311462.jpg) ![](https://i 阅读全文

posted @ 2021-10-28 09:38 折木家的招财猫阅读(67) 评论(0) 推荐(0)

贝叶斯与决策树

摘要：贝叶斯和决策树贝叶斯公式一言以蔽之：寻求概率的概率是多少。 $P(A|B)=\frac{P(B|A)·P(A)}{P(B)}$ 我们假设有这样一件事：抛三次硬币，有一个人抛了三次全部都是正面，这就很奇怪了，是不是可能作弊了，还是说真的运气好，贝叶斯在这的应用就是计算作弊的概率有多大。 $P(A 阅读全文

posted @ 2021-10-09 13:43 折木家的招财猫阅读(495) 评论(0) 推荐(0)

数据预处理

摘要：数据预处理处理数据缺失方法具体措施忽略直接删除，简单粗暴，缺失数据少的时候很管用手动填充重新收集数据，需要某些领域的专业知识，可行性不高自动填充取中位数或者平均数离群点检测 OUTLIER 世界之大，无奇不有，有时候明显和其他数据格格不入的数据，并不一定是错误的点，比如我们身边平阅读全文

posted @ 2021-09-30 14:17 折木家的招财猫阅读(281) 评论(0) 推荐(0)

数据挖掘导论

摘要：导论数据挖掘，单纯从字面意思理解，可能会存在误区，认为只是像爬虫一样做着简单重复劳动，而这只是冰山一角，更加全面的解释我认为应该是从数据中挖掘到价值和规律。数据矿——数据集总结一下数据来源 data.gov 美国政府公开数据集 kaggle open-EI UCI公开数据库 “挖掘机”——数据阅读全文

posted @ 2021-09-17 18:16 折木家的招财猫阅读(258) 评论(0) 推荐(0)

Loading

折木家的招财猫

随笔分类 - 数据挖掘

公告