GlenTt

导航

2025年9月15日 #

深度学习激活函数:从原理到选型

摘要: 深度学习激活函数:从原理到选型 1. 引言:激活函数的根本作用 在构建神经网络时,我们习惯性地在层与层之间添加激活函数,但其根本作用是什么?简而言之,激活函数是为网络引入非线性表达能力的核心组件。 如果一个深度神经网络完全由线性层(如全连接层、卷积层)堆叠而成,而没有非线性激活,那么无论网络有多少层 阅读全文

posted @ 2025-09-15 11:10 GRITJW 阅读(174) 评论(0) 推荐(0)

注意力机制:从核心原理到前沿应用

摘要: 注意力机制:从核心原理到前沿应用 注意力机制:从核心原理到前沿应用 如果你关注人工智能,无论是惊艳世人的GPT-4,还是精准洞察你购物偏好的推荐引擎,它们的背后都有一个共同的技术基石——注意力机制 (Attention Mechanism)。 然而,随着技术飞速发展,Attention的“家族”也日益庞大:Self-Attentio 阅读全文

posted @ 2025-09-15 10:17 GRITJW 阅读(462) 评论(0) 推荐(2)