深度学习激活函数:从原理到选型
摘要:
深度学习激活函数:从原理到选型 1. 引言:激活函数的根本作用 在构建神经网络时,我们习惯性地在层与层之间添加激活函数,但其根本作用是什么?简而言之,激活函数是为网络引入非线性表达能力的核心组件。 如果一个深度神经网络完全由线性层(如全连接层、卷积层)堆叠而成,而没有非线性激活,那么无论网络有多少层 阅读全文
posted @ 2025-09-15 11:10 GRITJW 阅读(174) 评论(0) 推荐(0)
注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio
浙公网安备 33010602011771号