一些概念
机器学习简言之就是从数据中学得模型的过程。假设用p来评估计算机程序在某任务类T上的性能,程序通过利用经验E在T任务中得到了性能改善,就说归于T,p对E进行了学习。
训练数据是指训练用的数据,其中的样本称为训练样本,样本集合也就是训练集,拥有结果信息(标记信息)的称为样例,所有标记(结果)的集合称为标记空间或输出空间。
从样本数据标记信息有无来看,学习任务可分为监督学习和无监督学习两类,监督学习包括分类和回归,无监督学习包括聚类。
分类是指观测值为离散的学习任务。
回归就是观测值为连续的。
聚类大意就是通过一些潜在概念将数据划分为组。
学得模型适应于新样本的能力称为泛化能力
基于公理、规则推导得出为演绎
基于样本数据得出为归纳,归纳分广义与狭义,广义是由数据学得,狭义则必须是由训练数据学得概念。
人生如水,不争高山,自然愈下,三年又三年。——struggle!

浙公网安备 33010602011771号