Jupyter notebook 读取文件的问题
摘要:Jupyter notebook只能打开当前目录下的数据集(txt、CSV等),所以需要把数据集倒导入到当前目录下,导入的方法是 1.文件不大时 直接上传文件。pd.read_csv读取. 2.文件较大时 把数据集拷贝到Jupyter notebook的目录下,如果不知道Jupyter notebo
阅读全文
posted @
2019-04-14 23:01
臭臭的球球
阅读(15137)
推荐(1)
机器学习-数据清洗和特征选择
摘要:一、数据清洗 1.预处理 2.去除、补全有缺失值的数据 3.去除、修改数据格式和内容错误的数据 4.去除、修改逻辑错误的数据 5.去除不需要的数据 6.关联性验证 1.预处理 1.1选择数据处理工具:可选择python 1.2查看数据集数据特征: 包括字段解释、数据来源、背景等一切可以描述数据的信息
阅读全文
posted @
2019-04-12 17:18
臭臭的球球
阅读(945)
推荐(0)
机器学习-逻辑回归
摘要:一、概述 Logistic回归是众多分类算法中的一员。通常,Logistic回归用于二分类问题,例如预测明天是否会下雨。当然它也可以用于多分类问题。 二、算法 Logistic回归 假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作为回归,如下图所示:
阅读全文
posted @
2019-04-10 14:32
臭臭的球球
阅读(573)
推荐(0)
机器学习-KNN
摘要:一、概述 1.基本工作原理:存在一个带有标签的样本集,即我们知道样本中的每个数据与所属分类的对应关系。输入没有标签的数据,将新数据的每个特征与样本中数据的对应特征进行比较,算法提取最相似样本的分来标签。选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,
阅读全文
posted @
2019-04-10 14:29
臭臭的球球
阅读(142)
推荐(0)
kaggle入窝-
摘要:#!/usr/bin/env python # coding: utf-8 # # sklearn常用方法 # # #标准化 (需要使用距离来度量相似性或用PCA降维时) # In[1]: from sklearn.preprocessing import StandardScaler data_train = StandardScaler().fit_transform(data_t...
阅读全文
posted @
2019-04-08 22:42
臭臭的球球
阅读(193)
推荐(0)
pycharm 中,解决特征很多,不能全部显示所有特征的问题
摘要:import pandas as ps 1、pd.set_option('expand_frame_repr', False) True就是可以换行显示。设置成False的时候不允许换行 2、pd.set_option('display.max_rows', 10) pd.set_option('d
阅读全文
posted @
2019-04-06 22:49
臭臭的球球
阅读(1710)
推荐(0)
去除 FutureWarning报错信息
摘要:models = {} models['LR'] = LogisticRegression() models['LDA'] = LinearDiscriminantAnalysis() models['KNN'] = KNeighborsClassifier() models['CART'] = DecisionTreeClassifier() models['NB'] = GaussianNB...
阅读全文
posted @
2019-04-01 21:38
臭臭的球球
阅读(1485)
推荐(0)
机器学习-线性回归
摘要:一、概述 1.简单线性回归 一种基于自变量(x)来预测因变量(Y)的方法.假设这两个变量是线性相关的,则寻找出根据特征或者自变量的线性函数来精准预测响应值.线性回归意味着可以将输入项分别乘以一些常量,再将结果加起来得到输出。需要说明的是,存在另一种成为非线性回归的回归模型,该模型不认同上面的做法,比
阅读全文
posted @
2019-04-01 15:05
臭臭的球球
阅读(423)
推荐(0)
机器学习-朴素贝叶斯
摘要:一、概述 朴素贝叶斯是贝叶斯决策理论的一部分,所以在讲述朴素贝叶斯之前有必要快速了解一下贝叶斯决策理论。 1、贝叶斯决策理论 假设现在我们有一个数据集,它由两类数据组成,数据分布如下图所示: 我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示
阅读全文
posted @
2019-04-01 11:05
臭臭的球球
阅读(314)
推荐(0)