wangya216 - 博客园

2025年12月4日

告别Jupyter包安装烦恼：!pip、%pip、!python -m pip 用法全解析

摘要：告别Jupyter包安装烦恼：!pip、%pip、!python -m pip 用法全解析在使用Jupyter Notebook/Lab进行数据分析、机器学习开发时，安装第三方库是基础操作，但很多人都会遇到「明明装了库却导入失败」「包装到全局环境而非当前内核」的问题。核心原因在于没选对pip的调用阅读全文

posted @ 2025-12-04 16:59 wangya216 阅读(150) 评论(0) 推荐(0)

scikit-learn 入门教程

摘要： Sklearn 入门教程：从思维到落地的完整指南引言 Sklearn（Scikit-learn）堪称Python机器学习领域的“瑞士军刀”——不仅API设计简洁统一、工具链覆盖全场景，更核心的是其蕴含的机器学习通用思维，能无缝迁移到TensorFlow、PyTorch等框架，适配分类、回归、聚类等阅读全文

posted @ 2025-12-04 13:38 wangya216 阅读(45) 评论(0) 推荐(0)

2025年12月3日

numpy中的视图概念

摘要：视图是什么？在 NumPy 中，“视图（view）” 是一个非常核心且高效的概念。理解它，能帮你写出更快、更省内存的代码。 🌟 一句话定义：视图是原数组的一个“窗口”或“别名”，它不复制数据，而是共享同一块内存。修改视图，会直接影响原数组；反之亦然。 🔍 举个例子 import numpy 阅读全文

posted @ 2025-12-03 11:06 wangya216 阅读(48) 评论(0) 推荐(0)

2025年12月2日

糖尿病预测（较好的代码）

摘要： In [4]: # 导入所有需要的库 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_diabetes from sklearn.ensemble import RandomFo 阅读全文

posted @ 2025-12-02 20:24 wangya216 阅读(51) 评论(0) 推荐(0)

2025年12月1日

聚类

摘要：聚类（Clustering） from sklearn.cluster import KMeans 🔤 逐词翻译： sklearn：scikit-learn，Python 最流行的机器学习库 cluster（聚类）：一种无监督学习任务，目标是把相似的数据点“分组” KMeans（K均值）：最经典、阅读全文

posted @ 2025-12-01 09:58 wangya216 阅读(139) 评论(0) 推荐(0)

2025年11月30日

【第9章】教材上代码

摘要：代码清单9-1 导入scikit-learn工具包¶ In [2]: import sklearn #导入sklearn工具包 from sklearn import ensemble #从sklearn工具包中导入ensemble模块 from sklearn.ensemble import Gr 阅读全文

posted @ 2025-11-30 10:05 wangya216 阅读(24) 评论(0) 推荐(0)

2025年11月29日

深度解析 Polynomial（多项式）：从数学本质到机器学习应用的全方位指南

摘要：深度解析 Polynomial（多项式）：从数学本质到机器学习应用的全方位指南在数学与机器学习的交叉领域，“多项式（Polynomial）”是一个贯穿基础与应用的核心概念——它既是描述非线性关系的数学工具，也是连接线性模型与复杂数据的桥梁。本文将从“名字由来”“数学定义”“生活实例”“机器学习应用阅读全文

posted @ 2025-11-29 14:42 wangya216 阅读(201) 评论(0) 推荐(0)

为什么大家老爱把非线性问题塞进线性模型（包含实战演练）？+Ridge：“防过拟合神器”

摘要：把“弯”的变成“直”的—— 为什么大家老爱把非线性问题塞进线性模型？（精修版）一、先讲个生活段子你去买菜，老板告诉你： “萝卜 2 块钱一斤，买 3 斤以上打 8 折，5 斤以上打 6 折。” 价格跟重量不是一条直线，是“折线”——典型的非线性。可你回家记账，只愿意写一行： “今天买萝卜花了阅读全文

posted @ 2025-11-29 11:10 wangya216 阅读(31) 评论(0) 推荐(0)

为什么说 y = a₁x₁ + a₂x₂ + b 是线性的？

摘要：为什么说 y = a₁x₁ + a₂x₂ + b 是线性的？ 0. 开场白很多人第一次看到这个方程都会点头：“嗯，线性！” 可一旦追问“为什么”，答案往往只剩一句：“因为图像是一条直线……呃不，一张平面？” 故事还没完。今天咱们把“直线”→“平面”→“数学定义”→“工程习惯”一次说完，带你从直觉到阅读全文

posted @ 2025-11-29 10:51 wangya216 阅读(21) 评论(0) 推荐(0)

彻底解决matplotlib中Z轴标签截断问题（强制预留标签空间）

摘要： I 彻底解决Z轴标签截断问题（强制预留标签空间）用“釜底抽薪”的思路——直接给Z轴标签单独预留独立空间，不用再微调边距和位置，无论你的画布尺寸、Matplotlib版本如何，都能100%完整显示，以下是必生效的代码：最终最终完整代码（标签无任何截断） import matplotlib.pypl 阅读全文

posted @ 2025-11-29 10:05 wangya216 阅读(43) 评论(0) 推荐(0)

Matplotlib 3D图入门教程

摘要： Matplotlib 3D图入门教程 Matplotlib 绘制 3D 图的核心是 mpl_toolkits.mplot3d 工具包，它在 2D 绘图基础上增加了“z轴”维度，原理和 2D 绘图一致——都是通过 Figure（画布）和 Axes（绘图区域）控制，只是 3D 图的 Axes 是专门的阅读全文

posted @ 2025-11-29 09:14 wangya216 阅读(181) 评论(0) 推荐(0)

2025年11月28日

`train_test_split` 是什么？

摘要：一、函数基础：train_test_split 是什么？ train_test_split 是 sklearn 提供的数据集划分工具，核心功能是：随机打乱原始数据（避免数据有序性导致的偏差）；按指定比例拆分数据为「两部分」（默认是训练集和测试集）；保证拆分后，x 和 y 的对应关系不混乱（即某阅读全文

posted @ 2025-11-28 21:56 wangya216 阅读(139) 评论(0) 推荐(0)

详解np.random.normal(0, 3, size=x.shape)

摘要：一、完整语法与参数解释 np.random.normal(loc=0, scale=1, size=None) 是 NumPy 中生成「正态分布（高斯分布）」随机数的核心函数，参数含义如下：参数名默认值作用说明对应代码中的含义 loc 0 正态分布的「均值（μ）」，决定分布的中心位置噪声的阅读全文

posted @ 2025-11-28 21:41 wangya216 阅读(165) 评论(0) 推荐(0)

随机种子是什么？

摘要：在编程（尤其是数据科学、机器学习）中，随机种子（Random Seed）是一个用于初始化随机数生成器的“起始值”，核心作用是让「随机过程可复现」——简单说，用相同的随机种子，每次运行代码得到的随机结果（如随机划分数据、生成随机噪声、模型初始化权重）完全一致；不设置种子则每次结果都不同。一、先看直观阅读全文

posted @ 2025-11-28 21:31 wangya216 阅读(524) 评论(0) 推荐(0)

多项式次数选择完整演示

摘要：多项式次数选择完整演示（Python）本文将通过人工生成数据→数据划分→多次数模型训练→验证集筛选最优次数→测试集评估的全流程，演示多项式回归中如何通过验证集选择最优次数，所有代码逐行解释，兼顾理论与实践。核心逻辑多项式回归的核心是通过增加高次项（如 (x^2, x^3)）拟合复杂数据，但阅读全文

posted @ 2025-11-28 21:25 wangya216 阅读(28) 评论(0) 推荐(0)

利用多项式模型对二维平面上的数据点进行拟合时，需要预先指定多项式的次数吗？

摘要：需要预先指定多项式的次数，且这个次数属于「超参数」，需通过验证集优化选择，核心逻辑和实操步骤如下：一、关键结论多项式回归中，“一次（线性）、二次、三次”本质是模型的结构超参数（决定模型复杂度），不能由数据自动学习，必须先指定候选次数（如1、2、3、4次），再通过训练+验证的流程筛选最优解。二、阅读全文

posted @ 2025-11-28 20:25 wangya216 阅读(35) 评论(0) 推荐(0)

2025年11月27日

除了 `%matplotlib inline`，Matplotlib 还有哪些魔法命令？

摘要：除了 %matplotlib inline：Matplotlib 相关魔法命令全解析（结构化指南）一、核心渲染模式配置（替换/扩展 inline）这类命令用于指定 Matplotlib 在 Jupyter 环境中的图表渲染方式，是 %matplotlib inline 的直接替代或进阶版本，核心阅读全文

posted @ 2025-11-27 12:45 wangya216 阅读(80) 评论(0) 推荐(0)

2025年11月26日

【第6章字符串】模糊匹配有哪些常用库？如何选择？

摘要：模糊匹配在不同场景下有不同的常用库，以下是主流选择及适用场景： 1. 字符串模糊匹配 FuzzyWuzzy（Python）基于编辑距离（Levenshtein距离），支持字符串相似度计算、匹配和搜索适合：字符串纠错、重复检测、部分匹配场景示例：from fuzzywuzzy import fu 阅读全文

posted @ 2025-11-26 10:56 wangya216 阅读(47) 评论(0) 推荐(0)

【第6章字符串】正则表达式支持模糊匹配吗？

摘要：是的，正则表达式支持模糊匹配，但需注意：标准正则（如 Python 内置 re 模块）的模糊匹配能力有限，而扩展库（如 Python regex 模块）提供了更完善的模糊匹配功能。以下是具体说明：一、标准正则的“模糊匹配”（有限支持）标准正则本身没有专门的“模糊匹配”语法，但可通过以下方式间接阅读全文

posted @ 2025-11-26 10:53 wangya216 阅读(53) 评论(0) 推荐(0)

【第6章字符串】Python中的模式匹配与模糊匹配：从精确到容错的智能识别

摘要： Python中的模式匹配与模糊匹配：从精确到容错的智能识别在日常编程中，我们常常需要判断一段文本是否符合某种“格式”或“规则”，或者在一堆数据中找出“看起来差不多”的内容。这两种需求分别对应着模式匹配（Pattern Matching）和模糊匹配（Fuzzy Matching）。它们看似相似，实则阅读全文

posted @ 2025-11-26 10:35 wangya216 阅读(112) 评论(0) 推荐(0)

为什么说NumPy 中的“广播”机制的“广播”一词非常形象？

摘要：这个词其实非常形象，英文是 Broadcasting。下面我为你详细解释一下为什么用“广播”这个词。英文原词：Broadcasting 中文直译：广播、播放、撒播。核心含义：从一个中心点向周围广阔的区域广泛地发送信号、信息或内容。比如：电视/无线电广播：电视台向所有观众发送节目信号。种阅读全文

posted @ 2025-11-26 10:26 wangya216 阅读(20) 评论(0) 推荐(0)

2025年11月25日

怎么理解np.array([10, 20]).reshape(-1, 1)？

摘要：非常好的问题！np.array([10, 20]).reshape(-1, 1) 是 NumPy 中将一维数组转为列向量的常用写法。下面我将从基本用法、-1 的含义、与 [:, None] 的对比、常见场景四个方面，彻底讲清楚 reshape 怎么用，尤其是这种带 -1 的写法。一、resh 阅读全文

posted @ 2025-11-25 19:42 wangya216 阅读(139) 评论(0) 推荐(0)

NumPy广播机制深度解析：为什么有时能加，有时报错？

摘要： NumPy 广播机制深度解析：从报错到精通，搞定维度对齐的核心逻辑在使用 NumPy 处理数组运算时，你是否常被这些问题困扰：为什么同样是 A + B，有时能算出结果，有时却报 ValueError？为什么加个 [:, np.newaxis]，原本失败的运算突然就成功了？广播的“自动扩展”到阅读全文

posted @ 2025-11-25 19:20 wangya216 阅读(86) 评论(0) 推荐(0)

plt.show()什么时候不用写？什么时候必须写？

摘要：在 Jupyter Notebook / IPython 环境中，默认开启 “自动显示模式”（%matplotlib inline 或 %matplotlib notebook），绘图后会自动渲染图像，无需手动调用 plt.show()。以下是具体分析： 1. 无需写 plt.show() 的场景阅读全文

posted @ 2025-11-25 13:52 wangya216 阅读(75) 评论(0) 推荐(0)

Pyplot vs Seaborn 功能实现对比（直方图+箱线图）&& Pyplot → Seaborn 快速迁移指南

摘要： Pyplot vs Seaborn 功能实现对比（直方图+箱线图）以下通过相同数据、相同图表类型的代码对比，直观展示两者的核心差异：Seaborn 基于 Matplotlib 封装，代码更简洁、默认样式更美观，且无缝对接 Pandas DataFrame；Pyplot 更灵活但需手动配置细节。阅读全文

posted @ 2025-11-25 13:51 wangya216 阅读(57) 评论(0) 推荐(0)