Loading

随笔分类 -  Data mining

Data mining refers to the process of searching hidden information through algorithms from a large amount of data
摘要:PyTools-包罗万象的python工具包🔧 ←--点击这里获取代码,欢迎star。 自己平时写的代码都以函数方式封装起来了,方便代码复用。 _________ ________ ________ ___ ________ ___ ___ |\___ ___\\ __ \|\ __ \|\ \ 阅读全文
posted @ 2021-12-03 11:02 pgCai 阅读(360) 评论(0) 推荐(0)
摘要:为什么要用k modes算法 k means算法是一种简单且实用的聚类算法,但是传统的k means算法只适用于连续属性的数据集(数值型数据),而对于离散属性的数据集,计算簇的均值以及点之间的欧式距离就变得不合适了。k modes作为k means的一种扩展(变种),距离使用汉明距离,适用于离散属性 阅读全文
posted @ 2020-02-14 18:56 pgCai 阅读(8630) 评论(0) 推荐(0)
摘要:大学生创新创业项目 The project was set up in TianJin Normal University. 2019-04 代码&详情见GitHub智取乐食 项目名称:智取乐食 项目介绍: "智取乐食"利用RFID射频识别技术、称重传感器、大数据分析和数据挖掘技术,设计一款集Web 阅读全文
posted @ 2019-12-22 20:16 pgCai 阅读(532) 评论(1) 推荐(0)
摘要:数据分析与挖掘 学习&实战记录 实战项目1: "智取乐食" 从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是 数据挖掘 。 数据挖掘基础 数据挖掘基本任务 数据挖掘的基本任务包括利用 阅读全文
posted @ 2019-12-18 08:55 pgCai 阅读(378) 评论(0) 推荐(0)
摘要:数据挖掘经典算法 先描述各种算法的基本知识与优略,后续会推出所有单个算法的具体描述、推导、代码。 C4.5决策树 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1.用信息增益率来选择属性,克服了用 阅读全文
posted @ 2019-12-06 22:10 pgCai 阅读(424) 评论(0) 推荐(0)
摘要:数据挖掘(一) 常见库 什么是数据分析与挖掘技术 所谓数据分析,即对已知的数据进行分析,然后提取出一些有价值的信 息,比如统计出平均数、标准差等信息,数据分析的数据量有时可能不 会太大,而数据挖掘,是 指对大量的数据进行分析与挖掘 ,得到一些 未 知的,有价值的信息 等,比如从网站的用户或用户行为数 阅读全文
posted @ 2019-12-06 21:29 pgCai 阅读(609) 评论(0) 推荐(0)