02 2019 档案
摘要:1. 前提介绍: 为什么需要统计量? 统计量:描述数据特征 1.1 集中趋势衡量 1.1.1 均值(平均数、平均值)(mean) {6 2 9 1 2} (6+2+9+1+2)/5=4 1.1.2 中位数(medain):将数据中的各个数值按照大小顺序排列,居于中间位置的变量 1.1.3 众数(mo
阅读全文
摘要:神经网络算法(neural network)上 1.背景 1.1 以人脑中的神经网络为启发,历史上出现过很多不同版本 1.2 最著名的算法是1980年的backpropagation 2. 多层向前神经网络(Multilayer Feed-Forward Neural Network) 2.1 Ba
阅读全文
摘要:支持向量机(support vector machine) 背景; 深度学*(2012)出现之前,SVM被认为机器学*中*十几年来最成功的,表现最好的算法 机器学*的一般框架; 训练集=>提取特征向量=>结合一定的算法(分类器:比如决策树,KNN)=>得到结果 SVM寻找区分两类的超平面(hyper
阅读全文
摘要:算法步骤: 为了判断未知实例的类别,以所有已知类别的实例作为参照 选择参数K 计算未知实例与所有已知实例的距离 选择最近K个已知实例 根据少数服从多数的投票法则(majority-voting),让未知实例归类为K个最邻近样本中最多数的类别 细节: 关于K 关于距离的衡量方法: Euclidean
阅读全文