上一页 1 2 3 4 5 6 7 ··· 10 下一页
摘要: 告别Jupyter包安装烦恼:!pip、%pip、!python -m pip 用法全解析 在使用Jupyter Notebook/Lab进行数据分析、机器学习开发时,安装第三方库是基础操作,但很多人都会遇到「明明装了库却导入失败」「包装到全局环境而非当前内核」的问题。核心原因在于没选对pip的调用 阅读全文
posted @ 2025-12-04 16:59 wangya216 阅读(150) 评论(0) 推荐(0)
摘要: Sklearn 入门教程:从思维到落地的完整指南 引言 Sklearn(Scikit-learn)堪称Python机器学习领域的“瑞士军刀”——不仅API设计简洁统一、工具链覆盖全场景,更核心的是其蕴含的机器学习通用思维,能无缝迁移到TensorFlow、PyTorch等框架,适配分类、回归、聚类等 阅读全文
posted @ 2025-12-04 13:38 wangya216 阅读(45) 评论(0) 推荐(0)
摘要: 视图是什么? 在 NumPy 中,“视图(view)” 是一个非常核心且高效的概念。理解它,能帮你写出更快、更省内存的代码。 🌟 一句话定义: 视图是原数组的一个“窗口”或“别名”,它不复制数据,而是共享同一块内存。 修改视图,会直接影响原数组;反之亦然。 🔍 举个例子 import numpy 阅读全文
posted @ 2025-12-03 11:06 wangya216 阅读(48) 评论(0) 推荐(0)
摘要: In [4]: # 导入所有需要的库 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_diabetes from sklearn.ensemble import RandomFo 阅读全文
posted @ 2025-12-02 20:24 wangya216 阅读(51) 评论(0) 推荐(0)
摘要: 聚类(Clustering) from sklearn.cluster import KMeans 🔤 逐词翻译: sklearn:scikit-learn,Python 最流行的机器学习库 cluster(聚类):一种无监督学习任务,目标是把相似的数据点“分组” KMeans(K均值):最经典、 阅读全文
posted @ 2025-12-01 09:58 wangya216 阅读(139) 评论(0) 推荐(0)
摘要: 代码清单9-1 导入scikit-learn工具包¶ In [2]: import sklearn #导入sklearn工具包 from sklearn import ensemble #从sklearn工具包中导入ensemble模块 from sklearn.ensemble import Gr 阅读全文
posted @ 2025-11-30 10:05 wangya216 阅读(24) 评论(0) 推荐(0)
摘要: 深度解析 Polynomial(多项式):从数学本质到机器学习应用的全方位指南 在数学与机器学习的交叉领域,“多项式(Polynomial)”是一个贯穿基础与应用的核心概念——它既是描述非线性关系的数学工具,也是连接线性模型与复杂数据的桥梁。本文将从“名字由来”“数学定义”“生活实例”“机器学习应用 阅读全文
posted @ 2025-11-29 14:42 wangya216 阅读(201) 评论(0) 推荐(0)
摘要: 把“弯”的变成“直”的—— 为什么大家老爱把非线性问题塞进线性模型?(精修版) 一、先讲个生活段子 你去买菜,老板告诉你: “萝卜 2 块钱一斤,买 3 斤以上打 8 折,5 斤以上打 6 折。” 价格跟重量不是一条直线,是“折线”——典型的非线性。 可你回家记账,只愿意写一行: “今天买萝卜花了 阅读全文
posted @ 2025-11-29 11:10 wangya216 阅读(31) 评论(0) 推荐(0)
摘要: 为什么说 y = a₁x₁ + a₂x₂ + b 是线性的? 0. 开场白 很多人第一次看到这个方程都会点头:“嗯,线性!” 可一旦追问“为什么”,答案往往只剩一句:“因为图像是一条直线……呃不,一张平面?” 故事还没完。今天咱们把“直线”→“平面”→“数学定义”→“工程习惯”一次说完,带你从直觉到 阅读全文
posted @ 2025-11-29 10:51 wangya216 阅读(21) 评论(0) 推荐(0)
摘要: I 彻底解决Z轴标签截断问题(强制预留标签空间) 用“釜底抽薪”的思路——直接给Z轴标签单独预留独立空间,不用再微调边距和位置,无论你的画布尺寸、Matplotlib版本如何,都能100%完整显示,以下是必生效的代码: 最终最终完整代码(标签无任何截断) import matplotlib.pypl 阅读全文
posted @ 2025-11-29 10:05 wangya216 阅读(43) 评论(0) 推荐(0)
摘要: Matplotlib 3D图入门教程 Matplotlib 绘制 3D 图的核心是 mpl_toolkits.mplot3d 工具包,它在 2D 绘图基础上增加了“z轴”维度,原理和 2D 绘图一致——都是通过 Figure(画布)和 Axes(绘图区域)控制,只是 3D 图的 Axes 是专门的 阅读全文
posted @ 2025-11-29 09:14 wangya216 阅读(181) 评论(0) 推荐(0)
摘要: 一、函数基础:train_test_split 是什么? train_test_split 是 sklearn 提供的数据集划分工具,核心功能是: 随机打乱原始数据(避免数据有序性导致的偏差); 按指定比例拆分数据为「两部分」(默认是训练集和测试集); 保证拆分后,x 和 y 的对应关系不混乱(即某 阅读全文
posted @ 2025-11-28 21:56 wangya216 阅读(139) 评论(0) 推荐(0)
摘要: 一、完整语法与参数解释 np.random.normal(loc=0, scale=1, size=None) 是 NumPy 中生成「正态分布(高斯分布)」随机数的核心函数,参数含义如下: 参数名 默认值 作用说明 对应代码中的含义 loc 0 正态分布的「均值(μ)」,决定分布的中心位置 噪声的 阅读全文
posted @ 2025-11-28 21:41 wangya216 阅读(165) 评论(0) 推荐(0)
摘要: 在编程(尤其是数据科学、机器学习)中,随机种子(Random Seed)是一个用于初始化随机数生成器的“起始值”,核心作用是让「随机过程可复现」——简单说,用相同的随机种子,每次运行代码得到的随机结果(如随机划分数据、生成随机噪声、模型初始化权重)完全一致;不设置种子则每次结果都不同。 一、先看直观 阅读全文
posted @ 2025-11-28 21:31 wangya216 阅读(524) 评论(0) 推荐(0)
摘要: 多项式次数选择完整演示(Python) 本文将通过 人工生成数据→数据划分→多次数模型训练→验证集筛选最优次数→测试集评估 的全流程,演示多项式回归中如何通过验证集选择最优次数,所有代码逐行解释,兼顾理论与实践。 核心逻辑 多项式回归的核心是通过增加高次项(如 (x^2, x^3))拟合复杂数据,但 阅读全文
posted @ 2025-11-28 21:25 wangya216 阅读(28) 评论(0) 推荐(0)
摘要: 需要预先指定多项式的次数,且这个次数属于「超参数」,需通过验证集优化选择,核心逻辑和实操步骤如下: 一、关键结论 多项式回归中,“一次(线性)、二次、三次”本质是模型的结构超参数(决定模型复杂度),不能由数据自动学习,必须先指定候选次数(如1、2、3、4次),再通过训练+验证的流程筛选最优解。 二、 阅读全文
posted @ 2025-11-28 20:25 wangya216 阅读(35) 评论(0) 推荐(0)
摘要: 除了 %matplotlib inline:Matplotlib 相关魔法命令全解析(结构化指南) 一、核心渲染模式配置(替换/扩展 inline) 这类命令用于指定 Matplotlib 在 Jupyter 环境中的图表渲染方式,是 %matplotlib inline 的直接替代或进阶版本,核心 阅读全文
posted @ 2025-11-27 12:45 wangya216 阅读(80) 评论(0) 推荐(0)
摘要: 模糊匹配在不同场景下有不同的常用库,以下是主流选择及适用场景: 1. 字符串模糊匹配 FuzzyWuzzy(Python) 基于编辑距离(Levenshtein距离),支持字符串相似度计算、匹配和搜索 适合:字符串纠错、重复检测、部分匹配场景 示例:from fuzzywuzzy import fu 阅读全文
posted @ 2025-11-26 10:56 wangya216 阅读(47) 评论(0) 推荐(0)
摘要: 是的,正则表达式 支持模糊匹配,但需注意:标准正则(如 Python 内置 re 模块)的模糊匹配能力有限,而扩展库(如 Python regex 模块)提供了更完善的模糊匹配功能。以下是具体说明: 一、标准正则的“模糊匹配”(有限支持) 标准正则本身没有专门的“模糊匹配”语法,但可通过以下方式间接 阅读全文
posted @ 2025-11-26 10:53 wangya216 阅读(53) 评论(0) 推荐(0)
摘要: Python中的模式匹配与模糊匹配:从精确到容错的智能识别 在日常编程中,我们常常需要判断一段文本是否符合某种“格式”或“规则”,或者在一堆数据中找出“看起来差不多”的内容。这两种需求分别对应着模式匹配(Pattern Matching)和模糊匹配(Fuzzy Matching)。它们看似相似,实则 阅读全文
posted @ 2025-11-26 10:35 wangya216 阅读(112) 评论(0) 推荐(0)
摘要: 这个词其实非常形象,英文是 Broadcasting。下面我为你详细解释一下为什么用“广播”这个词。 英文原词:Broadcasting 中文直译: 广播、播放、撒播。 核心含义: 从一个中心点向周围广阔的区域广泛地发送信号、信息或内容。比如: 电视/无线电广播: 电视台向所有观众发送节目信号。 种 阅读全文
posted @ 2025-11-26 10:26 wangya216 阅读(20) 评论(0) 推荐(0)
摘要: 非常好的问题!np.array([10, 20]).reshape(-1, 1) 是 NumPy 中将一维数组转为列向量的常用写法。 下面我将从 基本用法、-1 的含义、与 [:, None] 的对比、常见场景 四个方面,彻底讲清楚 reshape 怎么用,尤其是这种带 -1 的写法。 一、resh 阅读全文
posted @ 2025-11-25 19:42 wangya216 阅读(139) 评论(0) 推荐(0)
摘要: NumPy 广播机制深度解析:从报错到精通,搞定维度对齐的核心逻辑 在使用 NumPy 处理数组运算时,你是否常被这些问题困扰: 为什么同样是 A + B,有时能算出结果,有时却报 ValueError? 为什么加个 [:, np.newaxis],原本失败的运算突然就成功了? 广播的“自动扩展”到 阅读全文
posted @ 2025-11-25 19:20 wangya216 阅读(86) 评论(0) 推荐(0)
摘要: 在 Jupyter Notebook / IPython 环境中,默认开启 “自动显示模式”(%matplotlib inline 或 %matplotlib notebook),绘图后会自动渲染图像,无需手动调用 plt.show()。以下是具体分析: 1. 无需写 plt.show() 的场景 阅读全文
posted @ 2025-11-25 13:52 wangya216 阅读(75) 评论(0) 推荐(0)
摘要: Pyplot vs Seaborn 功能实现对比(直方图+箱线图) 以下通过 相同数据、相同图表类型 的代码对比,直观展示两者的核心差异:Seaborn 基于 Matplotlib 封装,代码更简洁、默认样式更美观,且无缝对接 Pandas DataFrame;Pyplot 更灵活但需手动配置细节。 阅读全文
posted @ 2025-11-25 13:51 wangya216 阅读(57) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 10 下一页