摘要: 常用的异常检测方法包括:箱线图、孤立森林、kmeans、z_score、dbscan 一、孤立森林 阅读全文
posted @ 2023-08-21 12:38 大哥的小虎牙 阅读(41) 评论(0) 推荐(0)
摘要: 一、孤立森林 阅读全文
posted @ 2023-08-21 12:35 大哥的小虎牙 阅读(25) 评论(0) 推荐(0)
摘要: 数据分析中一行转多行 1、test=[{"a":1,"b":2,"c":"aa|bb|cc"},{"a":2,"b":3,"c":"dd|ee"}] test=pd.DataFrame(test) 2、保留a、b两列作为索引,同时分割c,缺失的为None test.set_index(['a','b 阅读全文
posted @ 2023-02-05 17:59 大哥的小虎牙 阅读(282) 评论(0) 推荐(0)
摘要: 一、图分为以下类型类型 1、从图的形态上分为四类 联通图和非联通图:如果图中任意两个顶点之间都有边连接,则称为联通图,反之则成为非联通图 有向图和非有向图:如果边由一个顶点出发,指向另外一个顶点,则称为有向图 未加权图和加权图:未加权图的边和顶点无权重,而加权图的权重可以是体积、金额、次数等 循环图 阅读全文
posted @ 2023-01-15 15:40 大哥的小虎牙 阅读(24) 评论(0) 推荐(0)
摘要: 1、union 与 union all的区别:union会对查询到的数据进行去重,union all 则会保存所有查询到的结果 2、group by 1,2 表示:第一列、第二列属性 3、count(1) 和count(date)和count(*) 区别:count(1)和count(*)均表示代码 阅读全文
posted @ 2022-10-23 22:32 大哥的小虎牙 阅读(25) 评论(0) 推荐(0)