摘要:
1.算法描述 强化学习通常包括两个实体agent和environment。两个实体的交互如下,在environment的statestst下,agent采取actionatat进而得到rewardrtrt 并进入statest+1st+1。Q-learning的核心是Q-table。Q-table的 阅读全文
posted @ 2023-01-07 23:32
我爱C编程
阅读(220)
评论(0)
推荐(0)
摘要:
1.算法描述 整体思路如图1中所示, 其中输入序列使用randn函数来产生,卷积也采用matlab本身的函数conv,加性高斯白噪声用wgn函数来产生,由于实验的重点在Viterbi译码,下面介绍译码的实现。 译码总体上是先通过加——比——选来得到最优路径,然后根据状态转移图来得到解码后的码字。 由 阅读全文
posted @ 2023-01-07 23:26
我爱C编程
阅读(531)
评论(0)
推荐(0)

浙公网安备 33010602011771号