摘要: 导语:局部空间的线性拟合非线性(近邻分析,决策树),高维空间平面在低维空间的展示(例如:多项式;神经网络;SVM用核函数假装去高维)。 二、决策树(规则集)if-then 目前以二叉树为主,多叉树逐渐没落。更适合输入变量中分类变量很多的情况。 变量重要性是从区分角度定义。 (一)图形表示 分组过程是 阅读全文
posted @ 2021-10-19 11:35 WuliCoding 阅读(155) 评论(0) 推荐(0)
摘要: 导语:局部空间的线性拟合非线性(近邻分析,决策树),高维空间平面在低维空间的展示(例如:多项式;神经网络;SVM用核函数假装去高维)。 一、k-近邻 (一)步骤 1. 距离界定近邻 欧氏距离 DTW距离:衡量两个长度不同的时间序列的相似度 2. 参数k(调参) 1-近邻分类的优势:适用于实际分类边界 阅读全文
posted @ 2021-10-12 13:30 WuliCoding 阅读(197) 评论(0) 推荐(0)
摘要: Logit模型的经济学含义:PM10保持不变的时候,PM2.5增加一个单位,取1与取0的概率比增加e^0.05(优势比) 树的形式表示推理规则集 多项式的几何理解:y=x+x2 是3维空间中的平面在2维空间中的曲线 参数估计 回归预测中的平方损失函数 分类预测中的交互熵 p.s.K是类,二分类预测的 阅读全文
posted @ 2021-09-28 18:57 WuliCoding 阅读(91) 评论(0) 推荐(0)
摘要: 算法 科学研究的第四范式:数据密集型研究范式 人工智能发展阶段:符号主义人工智能(下棋)→机器学习(计算机自己找到规则,与统计学目标一致)→深度学习 统计学PART 数据:D1样本点、D2变量(特征) 分类VS聚类:有监督(输出变量参与建模) 机器学习VS经典统计:经典统计有假设,机器学习是归纳式分 阅读全文
posted @ 2021-09-26 11:54 WuliCoding 阅读(96) 评论(0) 推荐(0)