随笔分类 -  机器学习

摘要:这篇教程发布仅天时间,就在Hacker News论坛上收获了574赞。程序员们纷纷夸赞这篇文章的代码写得很好,变量名很规范,让人一目了然。 下面就让我们一起从零开始学习神经网络吧。 实现方法搭建基本模块——神经元 在说神经网络之前,我们讨论一下神经元(Neurons),它是神经网络的基本单元。神经元 阅读全文
posted @ 2021-04-16 18:01 cknds 阅读(790) 评论(0) 推荐(0)
摘要:首先python环境已经安装了numpy, scipy, sklearn, jieba # coding=utf-8 """ @desc: """ from scipy import sparse from sklearn.feature_extraction.text import CountVe 阅读全文
posted @ 2020-08-18 17:44 cknds 阅读(569) 评论(0) 推荐(0)
摘要:数据质量分析 脏数据包括:缺失值;异常值;不一致的值;重复数据及含有特殊符号的数据; 1.缺失值处理 统计缺失率,缺失数 2.异常值处理 (1)简单统计量分析 (2)3Q原则 正态分布情况下,小概率事件为异常值 不服从正太分布的,可以用原离平均值多少倍标准差来分析 (3)箱线图分析 使用descri 阅读全文
posted @ 2020-07-22 13:57 cknds 阅读(280) 评论(0) 推荐(0)
摘要:Python中的pandas模块进行数据分析。 接下来pandas介绍中将学习到如下8块内容: 1、数据结构简介:DataFrame和Series 2、数据索引index 3、利用pandas查询数据 4、利用pandas的DataFrames进行统计分析 5、利用pandas实现SQL操作 6、利 阅读全文
posted @ 2020-05-11 10:16 cknds 阅读(222) 评论(0) 推荐(0)
摘要:矩阵和数组的区别 数组中的元素可以是字符等矩阵中的只能是数这是二者最直观的区别。因为矩阵是一个数学概念(线性代数里的),数组是个计算机上的概念。你见过纯粹数学中有数组的概念吗?没有。因为计算机上(准确的说是信息科学中)常用到线性代数的知识,就引用了矩阵的概念。 《精通MATLAB6.5版》(张志涌编 阅读全文
posted @ 2020-05-09 23:49 cknds 阅读(1120) 评论(0) 推荐(1)
摘要:NumPy的详细教程(官网手册翻译) https://blog.csdn.net/xiaoxiangzi222/article/details/53084336/ NumPy 中文文档(NumPy中文网): https://www.numpy.org.cn/article/ NumPy的详细教程 先 阅读全文
posted @ 2020-01-03 09:24 cknds 阅读(249) 评论(0) 推荐(0)
摘要:一。 数组要比列表效率高很多 numpy高效的处理数据,提供数组的支持,python默认没有数组。pandas、scipy、matplotlib都依赖numpy。 pandas主要用于数据挖掘,探索,分析 matplotlib用于作图,可视化 scipy进行数值计算,如:积分,傅里叶变换,微积分 s 阅读全文
posted @ 2019-12-11 16:46 cknds 阅读(1485) 评论(0) 推荐(0)
摘要:聚类指的是把集合,分组成多个类,每个类中的对象都是彼此相似的。K-means是聚类中最常用的方法之一,它是基于点与点距离的相似度来计算最佳类别归属。 在使用该方法前,要注意(1)对数据异常值的处理;(2)对数据标准化处理(x-min(x))/(max(x)-min(x));(3)每一个类别的数量要大 阅读全文
posted @ 2019-12-11 16:30 cknds 阅读(18983) 评论(1) 推荐(1)
摘要:1.随机选择 选择初始质心,我们可以用最基本的随机方法,但是这种方法会导致一个局部最优解问题。即,将一个比较大的簇分裂,同时将两个较小的簇进行合并。 由于K-Means算法具有不稳定性,初始质心选择不同,结果也不同。所以解决局部最优的方法,其一可以多次运行算法,选择具有最小SSE值的那组作为最终解。 阅读全文
posted @ 2019-12-11 15:25 cknds 阅读(4034) 评论(0) 推荐(0)