摘要:
强化学习 马尔科夫决策过程 状态价值函数 使用强化学习算法训练智能体玩Flappy Bird游戏 import pygame import sys import numpy as np import random import pygame.surfarray as surfarray from p 阅读全文
摘要:
机器学习的优化目标 batch和mini-batch梯度下降 机器学习中常用优化算法的 Python 实践 import matplotlib.pyplot as plt import numpy as np from mpl_toolkits.mplot3d import Axes3D from 阅读全文