摘要: 声明:源文章本人发布在知乎账号:可乐,地址:https://zhuanlan.zhihu.com/p/55208457 数据集地址: https://tianchi.aliyun.com/dataset/dataDetail?dataId=56 数据集简介: 这是由阿里巴巴公司提供的一个关于淘宝广告 阅读全文
posted @ 2019-07-26 10:13 可乐5266 阅读(520) 评论(0) 推荐(0) 编辑
摘要: 一.K-近邻算法(k-NearstNeighbor,kNN) 使用某种距离计算方法进行分类。 思路:如果一个样本在特征空间中的k个最邻近样本中的大多数属于某一类别,则该样本也属于这个类别。该方法所选择的邻居都是已经正确分类的对象。 常用向量距离:欧式 马氏 信息熵。kNN中一般使用欧式距离计算: 统 阅读全文
posted @ 2019-07-22 15:43 可乐5266 阅读(3098) 评论(0) 推荐(0) 编辑
摘要: 假设有一组五年级学生身高数据,很明显第4个样本数据有问题。现在利用SPSS剔除 操作步骤: 得到一组z分数height变量 then,开始剔除个案 最终,下划线剔除第4个样本,filter变量1表示选中,0表示剔除。 阅读全文
posted @ 2019-07-19 14:03 可乐5266 阅读(14435) 评论(1) 推荐(0) 编辑
摘要: 一.数据预处理概述 常遇到的数据存在噪声、冗余、关联性、不完整性等。 数据预处理常见处理方法: (1)数据清理:补充缺失值、消除噪声数据、识别或删除离群点(异常值)并解决不一致性。 目标:数据格式标准化、异常数据清除、重复数据清除、错误纠正 (2)数据集成:将多个数据数据源中的数据进行整合并统一存储 阅读全文
posted @ 2019-07-16 14:09 可乐5266 阅读(2180) 评论(0) 推荐(0) 编辑
摘要: 1.ImportError: DLL load failed: 动态链接库(DLL)初始化例程失败。 进入终端,输入以下代码: >pip uninstall tensorflow >pip install --ignore-installed --upgrade tensorflow==1.5 测试 阅读全文
posted @ 2019-07-16 11:40 可乐5266 阅读(2400) 评论(0) 推荐(0) 编辑
摘要: 检查原因:自定义函数func()参数位置颠倒 解决办法:改为func(x,p)就解决了。 阅读全文
posted @ 2019-07-11 15:34 可乐5266 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 一. 矩阵操作函数库(Numpy) 1.np函数运算 二.科学计算核心包(Scipy) Scipy是科学计算程序的核心包,在Numpy基础上增加了众多数学、科学及工程计算中常用的库函数。如线性代数、常微分方程求加、信号/图像处理、稀疏矩阵。 1.最小二乘法(最小平方法) 最小二乘拟合属于优化问题。如 阅读全文
posted @ 2019-07-10 16:39 可乐5266 阅读(854) 评论(0) 推荐(0) 编辑