上一页 1 2 3 4 5 6 7 8 ··· 14 下一页
摘要: 贝尔曼方程、贝尔曼期望方程和贝尔曼最优方程是强化学习中描述状态值函数或动作值函数的核心方程,它们在不同场景下有不同的形式和用途。 以下是它们的定义、区别和联系: 1. 贝尔曼方程(Bellman Equation) 定义: 贝尔曼方程是一个广义的概念,它描述了状态值函数 $ V(s) $ 或动作值函 阅读全文
posted @ 2025-04-30 20:12 icuic 阅读(1081) 评论(1) 推荐(1)
摘要: import torch import torch.nn as nn import matplotlib.pyplot as plt import torchvision device = torch.device("cuda" if torch.cuda.is_available() else " 阅读全文
posted @ 2025-04-22 11:38 icuic 阅读(165) 评论(0) 推荐(0)
摘要: 在 Python 中,可迭代对象(Iterable)和迭代器(Iterator)是两个紧密相关但又有所不同的概念,下面从定义、特性、使用方法等方面详细介绍它们的区别。 定义 可迭代对象:是指实现了 __iter__() 方法的对象。这个方法会返回一个迭代器对象。常见的可迭代对象包括列表(list)、 阅读全文
posted @ 2025-04-21 15:47 icuic 阅读(165) 评论(0) 推荐(0)
摘要: 偏导数用于衡量多元函数中,某个自变量在其他自变量保持不变时,函数值随该自变量的变化率。 下面结合函数 \(y = \frac{1}{2}(x_1^2 + x_2^2)\) 在点\(x_1 = 2\),\(x_2 = 4\) 时来具体解释。 偏导数$\frac{\partial y}{\partial 阅读全文
posted @ 2025-04-15 14:46 icuic 阅读(54) 评论(0) 推荐(0)
摘要: 在NumPy里,切片操作是从数组里选取特定元素的强大手段。下面会从基础概念、一维数组切片、二维数组切片、高级切片技巧等方面来详细介绍。 基础概念 NumPy数组的切片语法和Python列表的切片语法相似,不过NumPy的切片操作更为强大,能够处理多维数组。基本的切片语法为array[start:st 阅读全文
posted @ 2025-04-12 23:53 icuic 阅读(176) 评论(0) 推荐(0)
摘要: 一直弄不清 Python 里的迭代器、装饰器和列表推导式,特的记录一下。 迭代器 迭代器是一种实现了 __iter__() 和 __next__() 方法的对象。__iter__() 方法返回迭代器自身,而 __next__() 方法返回迭代器的下一个值。当没有更多元素时,__next__() 方法 阅读全文
posted @ 2025-04-12 11:18 icuic 阅读(21) 评论(0) 推荐(0)
摘要: 在 Python 里,zip() 是一个内置函数,它能把多个可迭代对象(像列表、元组、字符串等)对应位置的元素组合成元组,最终返回一个迭代器。下面将详细介绍它的使用方法和特性。 基本语法 zip(*iterables) 其中,*iterables 表示可以传入一个或多个可迭代对象。 示例代码 1. 阅读全文
posted @ 2025-04-12 10:45 icuic 阅读(166) 评论(0) 推荐(0)
摘要: data_loader.py from torch.utils.data import Dataset import os import pandas as pd import numpy as np import torch class IrisDataLoader(Dataset): def _ 阅读全文
posted @ 2025-04-10 16:43 icuic 阅读(44) 评论(0) 推荐(0)
摘要: 可以通过以下两种常见的方法来修改 Jupyter Notebook 打开后显示的默认目录: 方法一:使用命令行参数指定目录 在启动 Jupyter Notebook 时,使用 --notebook-dir 参数来指定要打开的目录。 使用以下命令启动 Jupyter Notebook 并指定默认打开的 阅读全文
posted @ 2025-04-09 19:06 icuic 阅读(2588) 评论(0) 推荐(0)
摘要: Conda 是一个强大的开源包管理和环境管理系统,可在多种操作系统上使用,以下是其常用命令: 环境管理命令 创建环境 conda create --name your_env_name python=3.9 此命令会创建一个名为 your_env_name 的新环境,并指定 Python 版本为 3 阅读全文
posted @ 2025-04-09 18:56 icuic 阅读(142) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 ··· 14 下一页