随笔档案「2025年2月27日」：Q-learning算法 ... - AI_Engineer

2025年2月27日

摘要： 1. 初始化一个state * action大学的q_table 2. 采用ε贪心策略选择action，得到reward和下一步的状态 3. 根据reward和下一步的状态更新q_table import gym import numpy as np # 创建CliffWalking-v0环境 en 阅读全文

posted @ 2025-02-27 19:17 AI_Engineer 阅读(33) 评论(0) 推荐(0)

Mac 安装 Miniconda3

摘要：下载安装包 Intel 芯片：访问Miniconda 官方下载页面，下载适用于 macOS 的 Intel 版本，即Miniconda3-latest-MacOSX-x86_64.sh。 M 系列芯片：同样在上述官方下载页面，下载适用于 macOS 的 ARM 版本，即Miniconda3-late 阅读全文

posted @ 2025-02-27 14:48 AI_Engineer 阅读(812) 评论(0) 推荐(0)

xd_xumaomao

公告