上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 48 下一页

2021年3月25日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neuron, no. 4 (2021): 571-575 SUMMARY 最近的研究解决了建立生物物理学合理的脉冲神经模型的挑战性问题,该模型也能够进行复杂的信息处理。这一进步为神经科学和神经形态工程创造了新的机会,我们在一次在线焦点会 阅读全文
posted @ 2021-03-25 15:30 穷酸秀才大草包 阅读(224) 评论(0) 推荐(0)

2021年3月17日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE International Conference on Robotics & Automation. IEEE, 2018. Abstract 基于学习的方法已显示出在控制机器人任务方面的明显优势,例如信息融合能力,强大的鲁棒性 阅读全文
posted @ 2021-03-17 20:44 穷酸秀才大草包 阅读(785) 评论(0) 推荐(0)

2021年3月12日

摘要: 1 引言 视觉是智慧生物和智能体的基本功能,负责理解与感知外部世界。人类感知系统有超过80%信息量来自视觉系统,远远超过听觉系统、触觉系统以及其他感知系统之和。如何设计强大的视觉感知系统,以应用于计算机视觉技术和人工智能技术,一直是科学界和工业界的研究热点。 近年来,传统视频在视觉观赏角度取得了重大 阅读全文
posted @ 2021-03-12 13:08 穷酸秀才大草包 阅读(3405) 评论(0) 推荐(1)

2021年3月11日

摘要: 0 引言 神经网络被认为是当前人工智能发展的主要驱动力,其经历了几个发展阶段。第1个阶段是感知机。1958年;美国神经学家Rosenblatt提出了可以模拟人类感知能力的机器,并称之为"感知机",随后成功地在IBM704机上完成了感知机的仿真,并于1960年基于感知机实现了能够识别一些英文字母的神经 阅读全文
posted @ 2021-03-11 17:31 穷酸秀才大草包 阅读(6208) 评论(9) 推荐(0)

2021年2月27日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neuron, no. 6 (2003): 1063-1073 Summary 众所周知,化学突触传递是一个不可靠的过程,但这种不可靠的函数尚不清楚。在此,我考虑了一个假设,即大脑使用突触传递的随机性进行学习,类似于达尔文进化论利用基因突 阅读全文
posted @ 2021-02-27 20:03 穷酸秀才大草包 阅读(187) 评论(0) 推荐(0)

2021年2月26日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Published in D. Zaharie, D. Petcu, V. Negru, T. Jebelean, G. Ciobanu, A. Cicortas¸ A. Abraham and M. Paprzycki (eds.), 阅读全文
posted @ 2021-02-26 17:41 穷酸秀才大草包 阅读(271) 评论(0) 推荐(0)

2021年2月3日

摘要: 动态规划(DP)是一类优化方法,在给定一个用马尔可夫决策过程(MDP)描述的完备环境模型的情况下,其可以计算最优的策略。对于强化学习问题,传统的DP算法的作用有限。其原因有二:一是完备的环境模型只是一个假设 阅读全文
posted @ 2021-02-03 15:50 穷酸秀才大草包 阅读(123) 评论(0) 推荐(0)
摘要: 在强化学习所有的思想中,时序差分(TD)学习无疑是最核心、最新颖的思想。时序差分学习结合了蒙特卡洛方法和动态规划方法的思想。 阅读全文
posted @ 2021-02-03 15:45 穷酸秀才大草包 阅读(141) 评论(0) 推荐(0)
摘要: 蒙特卡洛算法仅仅需要经验,即从真实或者模拟的环境交互中采样得到的状态、动作、收益的序列。从真实经验中进行学习是非常好的,因为它不需要关于环境动态变化规律的先验知识,却依然能够达到最优的行为。从模拟经验中学习也是同样有效的,尽管这是需要一个模型,但这个模型只需要能够生成状态转移的一些样本,而不需要像动 阅读全文
posted @ 2021-02-03 15:40 穷酸秀才大草包 阅读(159) 评论(0) 推荐(0)

2021年2月1日

摘要: 在这一章中,我们将正式介绍有限马尔可夫决策过程(有限MDP),这也是本书后面要试图解决的问题。这个问题既涉及"评估反馈"(如前面介绍的赌博机问题),又涉及"发散联想",即在不同情境下选择不同的动作。MDP是序列决策的经典形式化表达,其动作不仅影响当前的即时收益,还影响后续的情况(又称状态)以及未来的 阅读全文
posted @ 2021-02-01 21:22 穷酸秀才大草包 阅读(296) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 48 下一页

导航