会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
姚春辉
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
41
下一页
2025年11月13日
神经网络滤波器用途
摘要: 神经网络中的“滤波器”(Filter),也常被称为“卷积核”(Kernel),是卷积神经网络(CNN)的核心组件。它的主要用途是从输入数据中提取特征,这是CNN在图像识别、语音处理等领域取得巨大成功的关键原因。 核心用途:特征提取 你可以把滤波器想象成一个“特征探测器”。它通过在输入数据上滑动并进行
阅读全文
posted @ 2025-11-13 18:20 姚春辉
阅读(8)
评论(0)
推荐(0)
2025年11月12日
神经网络中激活函数的作用
摘要: 我们来系统地梳理一下激活函数在神经网络中的作用。 核心作用:引入非线性 这是激活函数最根本、最重要的作用。 没有激活函数的神经网络是什么样的? 假设你有一个多层神经网络,但所有层都是线性的(即没有激活函数)。那么,无论你堆叠多少层,整个网络的最终输出都只是输入的一个线性组合。 例如: 第一层:out
阅读全文
posted @ 2025-11-12 16:46 姚春辉
阅读(15)
评论(0)
推荐(0)
如何实现大模型和本企业内部知识相结合形成一个适合本企业的小模型
摘要: 将大模型与企业内部知识结合,构建适合本企业的“小模型”或增强型应用,核心目标是让通用大模型具备企业专属的知识、语言风格和业务逻辑,同时避免从零训练大模型的高成本和高门槛。以下是具体实现路径和关键步骤: 一、核心实现思路:两种主流路径 根据企业需求(成本、实时性、定制深度),主要分为“模型微调”和“检
阅读全文
posted @ 2025-11-12 15:09 姚春辉
阅读(15)
评论(0)
推荐(0)
基础模型+场景微调
摘要: “基础模型 + 场景微调”是目前性价比最高、最主流的企业级AI落地方式。它的核心思想是:站在巨人的肩膀上,不重复造轮子。 下面我将为你详细拆解这个过程,并结合一个具体的例子来说明。 核心概念解析 基础模型 (Foundation Model) 是什么? 这是指像 GPT-4、Llama 3、文心一言
阅读全文
posted @ 2025-11-12 15:09 姚春辉
阅读(21)
评论(0)
推荐(0)
卷积神经网络的典型核心流程和分层
摘要: 卷积神经网络(CNN)的典型核心流程是“数据输入→特征提取→特征整合→预测输出”,分层围绕该流程展开,核心层包括输入层、卷积层、池化层、全连接层、输出层,部分场景会补充辅助层,整体结构清晰且各司其职。 一、典型核心流程(从数据到预测) 原始数据输入:通过输入层接收规范后的原始数据(如图像、序列)。
阅读全文
posted @ 2025-11-12 11:05 姚春辉
阅读(34)
评论(0)
推荐(0)
全连接层属于输入层、输出层还是隐藏层
摘要: 全连接层本身不固定属于输入层、输出层或隐藏层,它是一种“层的连接结构”,可作为隐藏层或输出层,输入层通常不称为全连接层。 核心定义 全连接层(Fully Connected Layer)的核心是“层内每个神经元与前一层所有神经元完全连接”,连接方式是关键,而非层在网络中的位置。 不同位置的应用 作为
阅读全文
posted @ 2025-11-12 10:58 姚春辉
阅读(11)
评论(0)
推荐(0)
卷积层属于输入层、输出层还是隐藏层
摘要: 卷积层的核心定位是隐藏层,仅特殊场景下可作为输出层的一部分,绝对不属于输入层。 核心结论 卷积层是深度学习(尤其CNN)中负责特征提取的核心层,本质是“带有局部连接、权值共享特性的计算层”,其功能和设计逻辑决定了它的主要角色是隐藏层。 不同位置的角色划分 作为隐藏层:这是最核心、最常见的用途。卷积层
阅读全文
posted @ 2025-11-12 10:50 姚春辉
阅读(7)
评论(0)
推荐(0)
神经元为什么要设置偏置bias
摘要: 这个问题问到了神经网络的核心设计逻辑!神经元设置偏置(bias)的核心作用是调整模型的“激活门槛”,让模型能更灵活地拟合数据规律。 核心结论 偏置是神经元的“偏移量”,用于控制激活函数被触发的难易程度,本质是为了让模型摆脱“必须通过原点”的限制,提升拟合能力。 关键理由 解决“零输入必零输出”的局限
阅读全文
posted @ 2025-11-12 10:37 姚春辉
阅读(18)
评论(0)
推荐(0)
2025年11月11日
为什么要标准化?归一化?
摘要: 核心结论是:标准化和归一化的核心目的是消除数据量纲差异、优化模型训练,二者适配不同数据场景和模型需求。 为什么需要标准化? 消除量纲影响,让不同单位的数据可对比。比如“身高(厘米)”和“体重(千克)”,标准化后能在同一尺度下参与计算。 避免模型受数据范围影响。像线性回归、SVM等依赖距离或梯度下降的
阅读全文
posted @ 2025-11-11 16:29 姚春辉
阅读(39)
评论(0)
推荐(0)
验证集和测试集的区别
摘要: 核心结论是:验证集用于模型调优与选择,测试集用于最终性能评估,二者用途完全分离,避免模型过拟合到测试数据。 核心定位与用途 验证集:服务于模型训练过程,用来调整超参数(如学习率、树深度)、选择模型结构(如神经网络层数)。 测试集:独立于训练流程,仅在所有调优完成后使用,评估模型在全新数据上的泛化能力
阅读全文
posted @ 2025-11-11 16:24 姚春辉
阅读(22)
评论(0)
推荐(0)
1
2
3
4
5
···
41
下一页
公告