摘要: 先来讲一下弱大数定律吧,这个比较好理解 弱大数定律的标准形式是这样的: \[\forall \epsilon>0,\underset{n\rightarrow\infty}{\lim}P(|\bar{X}_n-\mu|<\epsilon)=1 \]这里注意的是我们的极限符号是包含概率的,我们按照数列 阅读全文
posted @ 2025-02-28 23:47 最爱丁珰 阅读(135) 评论(0) 推荐(0)
摘要: R11 这个分组首先经过\(\frac{L}{R_1}\)的时间到达分组交换机,再经过\(\frac{L}{R_2}\)的时间到达接收主机,所以总时间为\(\frac{L}{R_1}+\frac{L}{R_2}\) R12 电路交换网络与分组交换网络相比,具有如下优点 电路交换网络适合实时服务因为其 阅读全文
posted @ 2025-02-28 22:17 最爱丁珰 阅读(18) 评论(0) 推荐(0)
摘要: 介绍一些其他的应用 阅读全文
posted @ 2025-02-28 15:54 最爱丁珰 阅读(7) 评论(0) 推荐(0)
摘要: 书上对残差网络的理解讲的有一点不清楚,解释一下。实际上,残差网络真正想干的事是通过在原网络上加入层/块(这就让原网络变得更深),而不改变原来的网络能够学习到的函数,以图\(7-8\)为例(这个图\(7-8\)画的是VGG的架构,与其下面的代码是相符合的,当然还有其他各种各样的残差块) 这两张图片中的 阅读全文
posted @ 2025-02-28 09:31 最爱丁珰 阅读(58) 评论(0) 推荐(0)
摘要: 当网络很深的时候会出现下面的问题 梯度消失是一般情况,所以上面讨论的是梯度消失的情况(每一层的梯度都很小,很多个很小的数相乘就会导致底部的层梯度比上面的层的梯度小);梯度爆炸是另外一回事 之所以会导致上面这种情况是因为不同层之间数据分布是有差别的。所以一个简单的想法就是我给数据的分布固定住 之所以不 阅读全文
posted @ 2025-02-28 08:49 最爱丁珰 阅读(12) 评论(0) 推荐(0)