摘要: 1.模型误差产生的原因 (1)模型无法表示基本数据的复杂度,而造成偏差。 (2)因模型对训练它所用到的数据过度敏感造成的方差。 2.由偏差造成的误差——准确率和欠拟合 有足够数据表示模型,但是由于模型不够复杂,不能捕捉基本关系,因而造成误差。 这样一来模型会系统的错误表示数据,从而导致准确率降低,这 阅读全文
posted @ 2018-03-06 17:29 未完代码 阅读(379) 评论(0) 推荐(0)
摘要: 交叉验证的目的是为了有在训练集中有更多的数据点,以获得最佳的学习效果,同时也希望有跟多的测试集数据来获得最佳验证。交叉验证的要点是将训练数据平分到k个容器中,在k折交叉验证中,将运行k次单独的试验,每一次试验中,你将挑选k个训练集中的一个作为验证集,剩下k-1个作为训练集,训练你的模型,用测试集测试 阅读全文
posted @ 2018-03-06 10:39 未完代码 阅读(269) 评论(0) 推荐(0)
摘要: #!/usr/bin/python import pickle import sys import matplotlib.pyplot sys.path.append("../tools/") from feature_format import featureFormat, targetFeatureSplit ### read in data dictionary, convert t... 阅读全文
posted @ 2018-03-06 10:02 未完代码 阅读(656) 评论(0) 推荐(0)