摘要: 基本的流程图 机器通过观测环境的状态来进行考虑做出哪一些相应的action,然后做出的action又会相应的影响环境的状态,影响环境的状态之后环境又会反馈给机器,使其得知当前的影响是正向的还是负向的。 强化学习相对于监督学习的优势。强化学习主要是用于在环境很少能给出reward的情况下(我们人很难知 阅读全文
posted @ 2021-06-10 21:24 克莱比-Kirby 阅读(306) 评论(0) 推荐(0)
摘要: 图与节点的基本 图直径: 图中所有的两两节点他们的最短路径的最大值。· 节点的度中心性: 公式Ndegree/(n-1) 也就是该节点的度/(全部的节点-1) 节点的特征向量中心性Eigenvector Centrality: 如果一个节点连接的度越多,其特征向量中心性越大。 中介中心性Betwee 阅读全文
posted @ 2021-06-10 21:23 克莱比-Kirby 阅读(717) 评论(0) 推荐(0)