随笔分类 -  机器学习

摘要:项目目标 由于大气运动极为复杂,影响天气的因素较多,而人们认识大气本身运动的能力极为有限,因此天气预报水平较低,预报员在预报实践中,每次预报的过程都极为复杂,需要综合分析,并预报各气象要素,比如温度、降水等。本项目需要训练一个二分类模型,来预测在给定天气因素下,城市是否下雨。 数据说明 本数据包含了 阅读全文
posted @ 2021-02-23 01:32 止一 阅读(2646) 评论(2) 推荐(0)
摘要:项目目标 泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。 项目过程 导入并探索数据 处理缺失值,删除与预测无关的特征 将分类变量转换为数值型变量 实例化模型并进行交叉验证 模型预测 阅读全文
posted @ 2021-02-21 14:24 止一 阅读(958) 评论(0) 推荐(0)
摘要:在机器学习中,我们一般会把数据集分为训练集和测试集,训练集用于创建模型,测试集用于评估模型的好坏。如果效果不好,我们就进行调参,继续在测试集上进行测试。实际上这有可能使得模型对于测试集过拟合,进而在面对新的未知数据时预测效果不好。 为了尽量避免针对测试集和训练集过拟合的问题,一般在数据量少的情况下, 阅读全文
posted @ 2021-02-20 22:07 止一 阅读(39) 评论(0) 推荐(0)
摘要:PCA 即主成分分析技术,旨在利用降维的思想,把多指标转化为少数几个综合指标。 假设目前我们的数据特征为3,即数据维度为三,现在我们想将数据降维为二维,一维: 我们之前的数据其实就是三维空间中的一个个点,这些点漫布在空间中,如下图所示 将这些数据去掉一个维度,也就是说将这些数据映射到某一个平面上,可 阅读全文
posted @ 2021-02-04 16:07 止一 阅读(341) 评论(0) 推荐(0)
摘要:import numpy as np import matplotlib.pyplot as plt 构造一元二次方程 x = np.linspace(-1, 6, 141) y = (x-2.5)**2-1 绘图 plt.plot(x,y) 目标函数 def J(theta): try: retu 阅读全文
posted @ 2020-11-26 01:02 止一 阅读(174) 评论(0) 推荐(0)
摘要:import numpy as np import matplotlib.pyplot as plt from sklearn import datasets # 获取数据 boston = datasets.load_boston() X = boston.data y = boston.targ 阅读全文
posted @ 2020-11-25 23:37 止一 阅读(98) 评论(0) 推荐(0)
摘要:衡量回归算法的标准 import numpy as np import matplotlib.pyplot as plt from sklearn import datasets 波士顿房产数据 boston = datasets.load_boston() x = boston.data[:, 5 阅读全文
posted @ 2020-11-25 23:31 止一 阅读(125) 评论(0) 推荐(0)
摘要:import numpy as np import matplotlib.pyplot as plt from sklearn import datasets 获取数据 boston = datasets.load_boston() X = boston.data y = boston.target 阅读全文
posted @ 2020-11-25 23:20 止一 阅读(108) 评论(0) 推荐(0)
摘要:实现 Simple Linear Regression import numpy as np import matplotlib.pyplot as plt x = np.arange(1, 6, dtype=float) y = np.array([1., 3., 2., 3., 5.]) plt 阅读全文
posted @ 2020-11-25 23:07 止一 阅读(84) 评论(0) 推荐(0)
摘要:import numpy as np from sklearn import datasets iris = datasets.load_iris() X = iris.data y = iris.target X[:10,:] array([[5.1, 3.5, 1.4, 0.2], [4.9, 阅读全文
posted @ 2020-11-25 22:32 止一 阅读(138) 评论(0) 推荐(0)
摘要:import numpy as np import matplotlib.pyplot as plt 最值归一化 x = np.random.randint(0,100,size=100) np.mean(x),np.std(x) (50.16, 28.943641788828167) x1 = ( 阅读全文
posted @ 2020-11-25 22:26 止一 阅读(117) 评论(0) 推荐(0)
摘要:import numpy as np import matplotlib import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_selection import train_test_split 阅读全文
posted @ 2020-11-25 22:18 止一 阅读(231) 评论(0) 推荐(0)
摘要:digits 手写数据测试 import numpy as np import matplotlib import matplotlib.pyplot as plt from sklearn import datasets from sklearn.model_selection import tr 阅读全文
posted @ 2020-11-25 22:10 止一 阅读(99) 评论(0) 推荐(0)
摘要:导入库 import numpy as np from sklearn import datasets import matplotlib.pyplot as plt 导入数据 iris = datasets.load_iris() 数据准备 X = iris.data y = iris.targe 阅读全文
posted @ 2020-11-25 22:08 止一 阅读(111) 评论(0) 推荐(0)
摘要:1、将数据分为测试数据和预测数据 2、数据分为data和target,data是矩阵,target是向量 3、将每条data(向量)绘制在坐标系中,就得到了一系列的点 4、根据每条data的target的不同,给点赋予不同的颜色 5、当新数据来到时,比如只有一条数据,将新数据绘制在坐标系中,就得到了 阅读全文
posted @ 2020-11-25 21:34 止一 阅读(122) 评论(0) 推荐(0)
摘要:>>> import numpy as np >>> L = np.random.random(100) >>> L array([0.82846513, 0.19136857, 0.27040895, 0.56103442, 0.90238039, 0.85178834, 0.41808196, 阅读全文
posted @ 2020-11-24 21:02 止一 阅读(95) 评论(0) 推荐(0)
摘要:>>> import numpy as np >>> np.zeros(10,dtype=int) array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0]) >>> np.zeros((3,5)) array([[0., 0., 0., 0., 0.], [0., 0., 0., 阅读全文
posted @ 2020-11-24 20:48 止一 阅读(71) 评论(0) 推荐(0)
摘要:生成数组 >>> import numpy as np >>> np.random.randn(10) array([ 0.52712347, -1.65888503, -1.00390235, 1.01367036, -0.15752943, -2.2986508 , -0.00966312, - 阅读全文
posted @ 2020-11-24 20:38 止一 阅读(164) 评论(0) 推荐(0)
摘要:%run %run C:\Users\User\Desktop\hello.py hello world %timeit %timeit L = [i for i in range(1000)] 29.1 µs ± 2.98 µs per loop (mean ± std. dev. of 7 ru 阅读全文
posted @ 2020-11-24 19:43 止一 阅读(118) 评论(0) 推荐(0)
摘要:import numpy as np x = np.arange(16) index = [3,5,8] x[index] array([3, 5, 8]) X = x.reshape(4,-1) X array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 阅读全文
posted @ 2020-11-24 19:35 止一 阅读(60) 评论(0) 推荐(0)