摘要: ①特征相关性处理 def filter_features_lr(threshold, corr_matrix, lr_data): # 去除对角线上的元素 np.fill_diagonal(corr_matrix.values, 0) # 找到相关性大于阈值的特征对 strong_corr_pair 阅读全文
posted @ 2025-12-16 15:40 起名字太难0123 阅读(4) 评论(0) 推荐(0)
摘要: 1.删除常值列 constant_columns = df.columns[df.nunique() == 1] print("常数列: ", constant_columns) df = df.drop(columns=constant_columns) print(len(df.columns) 阅读全文
posted @ 2025-12-08 15:26 起名字太难0123 阅读(6) 评论(0) 推荐(0)
摘要: 1.一维数组打印 public static void printArray(int[] arrays){ StringBuilder sb = new StringBuilder(); sb.append("["); for (int i = 0; i < arrays.length ; i++) 阅读全文
posted @ 2025-08-22 23:54 起名字太难0123 阅读(5) 评论(0) 推荐(0)
摘要: 一、数据清洗 缺失值:填充或删除缺失率过高的特征(缺失率不高的列,可尝试填充) 填充方法:knn、众数、中位数... 常值列:删除常值特征列 异常值:用箱线图(IQR 法则)、Z-score 或可视化(如散点图)识别异常值 进行完列数据清洗后,用pandas.drop_duplicates()删除完 阅读全文
posted @ 2025-08-11 00:02 起名字太难0123 阅读(46) 评论(0) 推荐(0)
摘要: 1.三大特性 封装、继承和多态 阅读全文
posted @ 2025-06-30 21:40 起名字太难0123 阅读(17) 评论(0) 推荐(0)
摘要: 1.Pandas 是数据科学和分析中最核心的库之一,专门用于高效处理结构化数据 2.处理.csv文件比处理excel快 Parquet比.csv更快 3.正则表达式是一种强大的文本匹配和处理工具,常用于字符串搜索、替换、分割和验证等操作。 4.列表:[1,2,3]; 有序; 不允许重复元素;可修改( 阅读全文
posted @ 2025-06-29 15:14 起名字太难0123 阅读(12) 评论(0) 推荐(0)
摘要: 面向过程:步骤清晰简单,第一步做什么,第二步做什么(简单问题) 面向对象:物以类聚,分类的思维方式,首先思考问题解决需要那些分类,然后对这些分类进行单独思考,最后对某些分类进行面向过程的思考(复杂问题,多人协作) 1.标识符注意 所有标识符都以字母、美元符($)、或者下划线开始 首字母可以是字母、美 阅读全文
posted @ 2025-05-25 16:26 起名字太难0123 阅读(9) 评论(0) 推荐(0)
摘要: 通过文件将数据持久化 C++中对文件操作需要包含头文件 文件类型分为两种: 1.文本文件:文件以文本的ASCII码形式储存在计算机中 2.二进制文件:文件以文本的二进制形式存储在计算机中,用户一般不能直接读懂 操作文件的三大类: 1.ofstream:写操作 2.ifstream:读操作 3.fst 阅读全文
posted @ 2025-04-20 20:45 起名字太难0123 阅读(33) 评论(0) 推荐(0)
摘要: 4.7 多态 4.7.1 多态的基本语法 多态是C++面向对象三大特性之一 多态分为两类 静态多态:函数重载和运算符重载属于静态多态,复用函数名 动态多态:派生类和虚函数实现运行时多态 静态多态和动态多态区别: 静态多态的函数地址早绑定 - 编辑阶段确定函数地址 动态多态的函数地址晚绑定 - 运行阶 阅读全文
posted @ 2025-04-19 17:38 起名字太难0123 阅读(11) 评论(0) 推荐(0)
摘要: 4.6 继承 4.6.1 继承的基本语法 继承的好处:可以减少重复的代码 继承的语法 class A : public B; A类称为子类或派生类 B类称为父类或基类 派生类中的成员,包含两大部分: 一类是从基类继承过来的,一类是自己增加的成员 从基类继承过来的表现其共性,而新增加的成员体现了其个性 阅读全文
posted @ 2025-04-17 16:38 起名字太难0123 阅读(19) 评论(0) 推荐(0)