随笔分类 - 数据挖掘
数据挖掘的一些概念以及应用
摘要:参考了https://blog.csdn.net/m0_37937917/article/details/81159193 预装环境: 1、安装了Anaconda ,可以从清华镜像下载。 2、环境安装了java,版本要7以及更高版本 在前面的环境前提下 开始下载安装pyspark 下载 Apache
阅读全文
摘要:起源 1801年,意大利天文学家朱塞普·皮亚齐发现了第一颗小行星谷神星。进行了40天的跟踪观测后,但由于谷神星运行到太阳背后,失去了具体位置信息。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学
阅读全文
摘要:学习数据挖掘算法也有一段时间了,某天小伙伴问我,你学的这个跟我们之前学校学的数据结构算法有什么区别吗。我很快回答:当然有区别啊。其实过后细想,究竟有啥区别。就是因为这个问题,才有了今天这篇文章。 那么在我们开始前,可以先暂停阅读一分钟,回忆下已了解数据结构的算法还有数据挖掘算法,思考下这两种算法有区
阅读全文
摘要:在文章开始前,各位读者大人如果听过数据仓库或者知道数据仓库,可以思考下数据仓库跟数据库有什么区别。如果未听过数据仓库,我猜你也想知道为什么有数据库了,还要数据仓库。 思考过后,我们来开始吧。 一、什么是数据仓库? 简单讲,数据仓库是一种特殊的数据库。数据仓库一般以主题为出发点进行的,也就是业务核心,
阅读全文
摘要:数据挖掘的核心是什么?这个的答案是算法应该没什么疑问。那数据挖掘的基石又是什么呢?那就是今天我们要来说的数据预处理。 什么是数据预处理? 数据科学家们一直想为数据预处理赋予一个定义。其实简单地说,数据预处理就是一种数据挖掘技术,本质就是为了将原始数据转换为可以理解的格式或者符合我们挖掘的格式。 那么
阅读全文
摘要:在数据挖掘中,在确定适用的算法模型之后,应该让我们的数据也能适用我们的算法。例如聚类,最近邻分类等算法,在这些算法中我们往往需要给我们的数据分类,相似的分为一类,不相似的分为不同类。 比如为了精准营销,商店需要建立顾客画像,得出具有类似特征(例如类似的收入,居住区域和年龄,职业等)的顾客组。也就是我
阅读全文
摘要:近几年大数据异常火热,往远了看去,毫不夸张得说未来10年依旧是大数据的天下,未来就是探索挖掘数据的应用场景,涉及金融,医疗,教育,交通,零售等等。 大数据目前分三个方向: ①、大数据开发方向 ②、数据挖掘、数据分析&机器学习方向 ③、大数据运维&云计算方向 那么你了解数据挖掘吗? 现在我有个问题,老
阅读全文
摘要:我理解的数据挖掘
什么是数据挖掘:数据中的知识发现(KDD),是自动或方便得提取代表知识的模式。
这是一个多学科的领域,包括 统计学,机器学习,模式识别,数据库技术,信息检索,网络科学,知识库系统,人工智能,高性能计算和数据可视化技术。
阅读全文

浙公网安备 33010602011771号