会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
好好学习,天天向上
啦啦啦啦,一起来自学打卡,冲冲冲~
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
37
下一页
2021年1月19日
【21年01月DW打卡】Task05 - 异常检测——高维数据异常检测( Feature Bagging、solation Forests、feature-bagging降方差的原因)
摘要: 异常检测——高维数据异常检测 小结 高维数据的特点: 维度爆炸后,数据可能会一场稀疏 在高维空间中,所有点对的距离几乎都是相等的(距离集中),这使得一些基于距离的方法失效 集成方法: Feature Bagging (特征组合) 属于集成方法的一种,探索不同维度的子集,将这些基学习器集合起来 可以自
阅读全文
posted @ 2021-01-19 23:12 山枫叶纷飞
阅读(1165)
评论(0)
推荐(0)
2021年1月17日
【21年01月DW打卡】Task04 - 异常检测,基于相似度的方法( 基于距离的度量[K近邻/单元分区/基于索引]、 基于密度的度量[LOF/k-distance]、pyod库两行代码调用LOF算法)
摘要: 异常检测——基于相似度的方法 小结 主要算法对比: 基于距离的度量 (异常点的k近邻距离要远大于正常点) K近邻: 两次循环暴利求解K个最近的点 单元分区法: 在距离计算中实现额外的节省,比较使用; 同时按单元格为最小判定标准——不够精细 基于索引: 构造索引来加快循环遍历(代价是构建索引需要额外的
阅读全文
posted @ 2021-01-17 22:49 山枫叶纷飞
阅读(315)
评论(0)
推荐(0)
【21年01月DW打卡】Task03 - 异常检测,线性模型 (线性回归[最小二乘法/梯度下降法]原理公式、PCA降维原理公式、数据可视化辅助、pyod演示PCA算法)
摘要: 异常检测——线性相关方法 小结 主要内容包括: 线性回归 :适用于数据基本上符合简单的线性的多项式模型,含最小二乘法/梯度下降法等方法 主成分分析:适用于维度爆炸的情况 其他 转jupyter的命令:jupyter nbconvert --to markdown E:\PycharmProjects
阅读全文
posted @ 2021-01-17 18:05 山枫叶纷飞
阅读(502)
评论(0)
推荐(0)
2021年1月15日
【21年01月DW打卡】Task02 - 异常检测,基于统计学的方法 (基于正态分布、基于多元异常点检测、使用直方图检测异常点、pyod演示HBOS算法)
摘要: #异常检测——基于统计学的方法 主要内容包括: 高斯分布 箱线图 小结 转换命令: 转换命令 jupyter nbconvert --to markdown E:\PycharmProjects\TianChiProject\00_山枫叶纷飞\competitions\011_dw_AnomalyD
阅读全文
posted @ 2021-01-15 22:00 山枫叶纷飞
阅读(833)
评论(0)
推荐(0)
【BUG12】排查解决一个锁超时 "MySQLTransactionRollbackException: Lock wait timeout exceeded; try restarting transaction" 的SQL问题
摘要: 排查 报错日志 org.springframework.dao.CannotAcquireLockException: ### Error updating database. Cause: com.mysql.jdbc.exceptions.jdbc4.MySQLTransactionRollba
阅读全文
posted @ 2021-01-15 16:10 山枫叶纷飞
阅读(235)
评论(0)
推荐(0)
2021年1月13日
【20年12月DW打卡】joyful-pandas - 期末task11 - 综合练习
摘要: Task 11 综合练习 小结 题目链接: http://datawhale.club/t/topic/579/6 其他 转换命令 jupyter nbconvert --to markdown E:\PycharmProjects\TianChiProject\00_山枫叶纷飞\competiti
阅读全文
posted @ 2021-01-13 22:26 山枫叶纷飞
阅读(194)
评论(0)
推荐(0)
2021年1月12日
【21年01月DW打卡】Task01 - 异常检测概述 (常用场景、常见方法、PyOD工具库+KNN异常检测示例)
摘要: 异常检测概述 1、什么是异常检测 异常检测(Outlier Detection),顾名思义,是识别与正常数据不同的数据,与预期行为差异大的数据。 识别如信用卡欺诈,工业生产异常,网络流里的异常(网络侵入)等问题,针对的是少数的事件。 1.1 异常的类别 点异常:指的是少数个体实例是异常的,大多数个体
阅读全文
posted @ 2021-01-12 22:10 山枫叶纷飞
阅读(865)
评论(0)
推荐(0)
2021年1月10日
【12月DW打卡】joyful-pandas - Task10:时序数据(时间戳、时间差、日期偏置、to_datetime和date_range、dt对象、滑动窗口、重采样)
摘要: 第十章 时序数据 小结 原文链接: https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch10.html Offset aliases的freq链接速查: https://pandas.pydat
阅读全文
posted @ 2021-01-10 11:58 山枫叶纷飞
阅读(377)
评论(0)
推荐(0)
2021年1月7日
【12月DW打卡】joyful-pandas - Task09:类别类型数据(categories/cat对象、有序分类、区间类别)
摘要: 第九章 pandas 类别型数据(categories) 小结 原文指路:(joyful-pandas)[https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch9.html#cat] jupyte
阅读全文
posted @ 2021-01-07 23:27 山枫叶纷飞
阅读(329)
评论(0)
推荐(0)
【Pandas】resample重采样中的周‘W’按周日开始为一周('W'的频率偏移默认为‘right’、使用label = 'left' 重设)+ 常用freq的别名/注释
摘要: 现实原因的冲突 https://cn.bing.com/search?q=%E5%9B%BD%E5%A4%96%E7%9A%84%E5%91%A8%E6%98%AF%E4%BB%8E%E5%91%A8%E5%87%A0%E5%BC%80%E5%A7%8B 每星期的开始时间各国有所不同。许多英语国家、
阅读全文
posted @ 2021-01-07 14:03 山枫叶纷飞
阅读(2981)
评论(0)
推荐(1)
上一页
1
2
3
4
5
6
7
8
9
···
37
下一页
公告