摘要: 全文链接:http://tecdat.cn/?p=3232 原文出处:拓端数据部落公众号 检测异常值的4种方法和R语言时间序列分解异常检测 什么是异常值? 异常值是与其他观测值有显著差异的数据点。异常值会显著扭曲特征分布和ML工作,因此我们需要观察并形成处理它们的策略。 异常值是如何出现的? 这种观 阅读全文
posted @ 2022-10-22 12:55 拓端tecdat 阅读(534) 评论(0) 推荐(0)
摘要: 全文链接:http://tecdat.cn/?p=29277 原文出处:拓端数据部落公众号 一些标准的图形工具可以极大地帮助理解数据集并评估所建议模型的质量。 学生考试成绩 例如,数据集包含600个观察结果,用于国家统计教育中心对学生进行的一项非常大的研究。数据集中的一些变量包括: •性别:性别男性 阅读全文
posted @ 2022-10-22 12:52 拓端tecdat 阅读(130) 评论(0) 推荐(0)
摘要: 全文下载:http://tecdat.cn/?p=29221 全文出处:拓端数据部落公众号 传统上,协整的测试是在非常长的时间内进行的,本案例研究A测试了1960-2010年期间T-Bill利率和国债收益率之间的平衡。 但是作为量化主义者,我们必须在市场数据中寻找共同运动。 现货曲线 银行提供每日收 阅读全文
posted @ 2022-10-22 12:50 拓端tecdat 阅读(397) 评论(0) 推荐(0)
摘要: 全文链接:http://tecdat.cn/?p=29196 全文出处:拓端数据部落公众号 吸烟、喝酒和赌博被认为是由许多因素造成的。Logistic回归分析是一个非常有效的模型,可以检验各种解释变量和二元反应变量之间的关系。同时,双变量模型分析也被用于检验单变量模型之间的相关性。本项目的目的是利用 阅读全文
posted @ 2022-10-22 12:48 拓端tecdat 阅读(207) 评论(0) 推荐(0)
摘要: 全文链接:http://tecdat.cn/?p=22251 原文出处:拓端数据部落公众号 归一化数据是数据科学中的一项常见任务。有时它可以让我们加快梯度下降的速度或提高模型的准确性,在某些情况下,它绝对是至关重要的。 【视频】逆变换抽样将数据标准化和R语言结构化转换:BOX-COX、凸规则变换方法 阅读全文
posted @ 2022-10-22 12:46 拓端tecdat 阅读(165) 评论(0) 推荐(0)