博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2026年3月5日

摘要: 心脑血管疾病早期征兆 执行摘要 本报告整合世界卫生组织(WHO)、美国心脏协会(AHA)、美国梅奥诊所(Mayo Clinic)与美国卒中协会(ASA/stroke.org)等权威来源,归纳并解释心脑血管疾病(包括冠心病、心肌梗死、脑卒中/短暂性脑缺血发作等)的早期征兆、可测量的危险信号、临床筛查建 阅读全文

posted @ 2026-03-05 17:47 steve.z 阅读(3) 评论(0) 推荐(0)

摘要: scalers.pkl 是一个 Python pickle 格式的文件,用于保存机器学习中的数据缩放器(scaler)对象。 文件的用途 这个文件通常由 scikit-learn(sklearn)库中的缩放器类(如 StandardScaler、MinMaxScaler 等)生成。它的主要作用是: 阅读全文

posted @ 2026-03-05 15:31 steve.z 阅读(2) 评论(0) 推荐(0)

摘要: 模型评估指标:最常用的 10 个指标 用最简单的语言,讲清楚最实用的 10 个指标。 基础概念:混淆矩阵 学所有分类指标前,先理解这张表——它记录了模型"猜对了什么、猜错了什么": 预测为正 预测为负 实际为正 ✅ TP(猜对了正) ❌ FN(漏掉了正) 实际为负 ❌ FP(误报了负) ✅ TN(猜 阅读全文

posted @ 2026-03-05 12:06 steve.z 阅读(4) 评论(0) 推荐(0)

摘要: 将本地仓库推送到 GitHub 远程服务器的步骤如下: 完整的推送流程 1. 在 GitHub 上创建远程仓库 首先,你需要在 GitHub 上创建一个空的仓库: 登录 GitHub,点击右上角 "+" → "New repository" 输入仓库名称(建议与本地项目名称相同) 不要勾选 "Ini 阅读全文

posted @ 2026-03-05 08:28 steve.z 阅读(4) 评论(0) 推荐(0)

摘要: GitHub 本地仓库推送完整教程(基于macOS) 前置准备 在开始之前,确保你已完成以下准备工作: 1. 安装 Git 在 macOS 上,推荐使用 Homebrew 安装: brew install git 验证安装: git --version 2. 配置 Git 用户信息 首次使用 Git 阅读全文

posted @ 2026-03-05 08:16 steve.z 阅读(34) 评论(0) 推荐(1)

2026年3月4日

摘要: sed 命令详解 什么是 sed sed 是 Stream Editor(流编辑器)的缩写,是 Unix/Linux 系统中一个强大的文本处理工具。它用于对文本进行查找、替换、删除、插入等操作,通常用于处理大型文本文件或进行批量文本替换。 sed 的核心特点 流处理:逐行读取文件,不需要一次性加载整 阅读全文

posted @ 2026-03-04 14:31 steve.z 阅读(6) 评论(0) 推荐(0)

摘要: "Review 代码"的含义与详细教程 什么是 Code Review(代码审查) Code Review(代码审查) 是指在软件开发过程中,由一个或多个开发人员对另一个开发人员编写的代码进行系统性的检查和评估。这是现代软件开发中的一个重要实践,目的是确保代码质量、发现潜在问题,并促进团队知识共享。 阅读全文

posted @ 2026-03-04 13:59 steve.z 阅读(10) 评论(0) 推荐(0)

2026年3月3日

摘要: 一句话解释 .gitkeep 是一个“占位文件”,放在空目录里,好让 Git 能追踪这个目录,本身没有任何特殊语法或 Git 内置含义,只是一个社区约定。 为什么需要 .gitkeep? Git 只追踪文件,不追踪空目录。 如果你有一个空目录,没有任何文件,git add . / git commi 阅读全文

posted @ 2026-03-03 18:36 steve.z 阅读(5) 评论(0) 推荐(0)

摘要: .parquet 与 .pt 文件详解:数据清洗与特征提取中的文件格式选择 目录 背景:为什么需要了解这些格式? .parquet 文件详解 .pt 文件详解 为什么数据清洗产生 .parquet? 为什么特征提取产生 .pt? 为什么不继续使用 .csv 和 .json? 完整的机器学习数据流水线 阅读全文

posted @ 2026-03-03 18:12 steve.z 阅读(7) 评论(0) 推荐(0)

摘要: 【机器学习基础】大模型训练必读:数据清洗与特征提取全流程指南 在训练大模型(LLM)或任何深度学习模型时,我们常说:"Garbage In, Garbage Out"(垃圾进,垃圾出)。数据的质量直接决定了模型的上限,而算法只是逼近这个上限的手段。 本文将详细拆解模型训练前的两个关键环节:数据清洗与 阅读全文

posted @ 2026-03-03 17:30 steve.z 阅读(14) 评论(0) 推荐(0)